pandas.parser.CParserError: データ暗号化エラー
pandas ライブラリを使用して .csv ファイルを読み取ろうとすると、次のエラーが発生します。謎のエラー: pandas.parser.CParserError: データのトークン化エラー。 C エラー: 行 3 に 2 つのフィールドが予期され、12 を参照しました。パンダのドキュメントを参照しても、明確な解決策は見つかりません。
一見単純なコード スニペット:
path = 'GOOG Key Ratios.csv' #print(open(path).read()) data = pd.read_csv(path)
がこれの餌食になります。わかりにくいエラー。この障害をどうやって克服するかという疑問が生じます。代替モジュールやプログラミング言語も検討すべきでしょうか?
一筋の希望
開発者の皆さん、心配しないでください。解決策はパンダ自体の領域内にあります。次の引数を pd.read_csv() 関数に追加することで、エラーを正常に解決できます:
data = pd.read_csv('file1.csv', on_bad_lines='skip')
この変更により、解析の問題を引き起こす行を無視するようにパンダに指示され、問題を効果的に回避できます。さらに、破損した行の処理をより詳細に制御したい場合は、カスタム コールバック関数を定義して、カスタマイズされた応答を提供できます。
1.3.0 より前のバージョンの Pandas には、次の構文が適用されます。
data = pd.read_csv("file1.csv", error_bad_lines=False)
これらの調整により、謎のエラーが消え、データ操作にパンダの力を自由に利用できるようになります。が必要です。
以上がPandas `CParserError`: 「X フィールドが予想されましたが、Y が見つかりました」を解決する方法?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。