Python で HTML ファイルを書き込む際の中国語文字化けの問題
クローラがクロールした HTML を open 関数を使ってファイルに書き込みます、時々コンソールで 文字化けはしませんが、ファイルに書き込まれたhtml内の中国語が文字化けします
ケース分析
以下を見てください。コード:
# 爬虫未使用cookiefrom urllib import requestif __name__ == '__main__': url = "http://www.renren.com/967487029/profile" rsp = request.urlopen(url) html = rsp.read().decode() with open("rsp.html","w")as f: # 将爬取的页面 print(html) f.write(html)
は問題ないようです。コンソール上の HTML 出力には中国語の文字化けはありませんが、作成された HTML ファイル
# 解決策
encoding="" という名前の open メソッドのパラメーターを使用し、encoding="utf-8"## を追加します。 #
#読んでいただきありがとうございます。多くの利益が得られることを願っています。 python チュートリアル 以上がPythonで書いたhtmlファイルが文字化けする場合の解決方法(画像と文章で詳しく解説)の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。# 爬虫未使用cookiefrom urllib import requestif __name__ == '__main__':
url = "http://www.renren.com/967487029/profile"
rsp = request.urlopen(url)
html = rsp.read().decode() with open("rsp.html","w",encoding="utf-8")as f: # 将爬取的页面
print(html)
f.write(html)