Pandas CSV 解析の「pandas.parser.CParserError: データのトークン化エラー」のトラブルシューティング
「pandas.parser.CParserError」が発生する可能性があります: データのトークン化エラーが発生しました。 Pandas ライブラリの pd.read_csv 関数。CSV ファイルの特定の行にあるフィールドの予想数と発生したフィールド数の間の不一致を示します。
エラー メッセージは、ライブラリが特定の行に 2 つのフィールドを予期していたことを意味します (この場合は 3 行目)、代わりに 12 が見つかりました。この不一致は、値の欠落やフィールド内の余分なカンマなど、不正なデータが原因で発生する可能性があります。
問題を解決して CSV 解析を続行するには、次のアプローチを検討してください。
on_bad_lines パラメータ:
data = pd.read_csv(path, on_bad_lines='skip')
無効な行をより高度に処理するには、カスタム呼び出し可能オブジェクトを実装します。不正な行が検出されたときに実行されるアクションを定義します。
Pandas のバージョンが 1.3.0 未満の場合は、 on_bad_lines パラメータと error_bad_lines:
data = pd.read_csv("file1.csv", error_bad_lines=False)
Pandas の代わりに、次のことができます。 Python の CSV モジュールを使用して探索します。これは、CSV ファイルを解析するための基本的なユーティリティを提供します。ただし、Pandas と同じレベルの柔軟性や機能は提供されない可能性があります。
以上がCSV ファイルの読み取り時の Pandas `pandas.parser.CParserError: Error tokenizing data` エラーを解決する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。