python - 使用selenium，用PhantomJS抓取网页后保存为.html后出现中文乱码？

Question

保存的html文档中出现中文乱码：&lt;meta name="keywords" content="鈽呯敤閽㈢惔璇犻噴鍛ㄦ澃浼︹櫔鏃犱笌浼︽瘮涓嶉€濈粡鍏革紝姊︽兂瀹禯eDragon锛岄挗鐞达紝缁忓吀锛岃交闊充箰"&gt; 代码： {代码...} 1.使用...

黄舟 · Answer

これを試してください:

リーリー

高洛峰 · Answer

リーリー

高洛峰 · Answer

はい、私が必要としているのは、曲のコメントと曲名をクロールすることです。最初は Web ページをクロールして、ゆっくりと正規化するつもりでした。後で、奇数番号の Web ページが中国語で正常であることがわかりました。番号付きの Web ページが文字化けしていました (クロールしたいのですが、50 の Web ページ)。その後、元に戻りました。これは、win7 にバグがあり、Linux がインストールされていないことを意味します。要件に従って xpath 分析を使用します。
例:
ele_com = browser.find_element_by_xpath("//p[@class='cnt f-brk']")
返されたデータは正常です。まだcmdで実行中です。
データをクロールしたい場合は、いじらずにモジュール上のツールを使用するだけです