python - 使用selenium，用PhantomJS抓取网页后保存为.html后出现中文乱码？

Question

保存的html文档中出现中文乱码：&lt;meta name="keywords" content="鈽呯敤閽㈢惔璇犻噴鍛ㄦ澃浼︹櫔鏃犱笌浼︽瘮涓嶉€濈粡鍏革紝姊︽兂瀹禯eDragon锛岄挗鐞达紝缁忓吀锛岃交闊充箰"&gt; 代码： {代码...} 1.使用...

黄舟 · Answer

이것을 시도해 보십시오:

으아아아

高洛峰 · Answer

高洛峰 · Answer

좋아, 내 필요는 노래의 댓글과 노래 제목을 크롤링하는 것입니다. 원래는 웹페이지를 크롤링하여 천천히 정규화할 계획이었습니다. 나중에 홀수 웹페이지는 중국어로 정상적이고 짝수는- 번호가 매겨진 웹페이지가 깨져서(크롤링하고 싶습니다. 웹페이지 50개) 반전되었습니다. 이는 win7에 버그가 있고 Linux가 설치되지 않았음을 의미합니다. 요구 사항에 따라 xpath 분석을 사용합니다.
예:
ele_com = browser.find_element_by_xpath("//p[@class='cnt f-brk']")
반환된 데이터는 정상입니다. 여전히 cmd에서 실행 중입니다.
따라서 데이터를 크롤링하려면 모듈에 있는 도구를 사용하면 됩니다.