python - pandas读取中文的时候乱码要如何解决?

Question

下载了一份新浪微博的数据,但是原始数据是用csv的,在mac上没办法直接打开,读取的时候,也会错误,会出现 {代码...} 然后自己google,发现read_csv('file', encoding = "ISO-8859-1") 这样的时候读取不会有错 但是读...

伊谢尔伦 · Answer

コードと元のデータをください

いくつかの有能なコードと代表的なデータを書くだけで、数ギガバイトのビッグデータを作成しないでください~

誰が見ていますか？

大家讲道理 · Answer

私もあなたと同じ状況にあり、多くのエンコードを試しましたが、まだ役に立ちません。ただし、データがUTF8でエンコードされている場合、当面考えられる解決策は次のとおりです。 openを使って一行ずつ読み込んでいくと、エンコード変換が発生するとエラーが破棄されてしまうため、実際にはかなりのデータ量になります

高洛峰 · Answer

cp1252 を使用してみることもできます。最善の方法は、まずchardetパッケージ(https://pypi.python.org/pypi/...)を使用して、ファイルにどのようなエンコーディングが使用されているかを確認することです。

天蓬老师 · Answer

試してみても問題ありませんでした。環境のエンコーディングに問題があると思いますので、次のコードを試してみてください。リーリー