python - 使用selenium，用PhantomJS抓取网页后保存为.html后出现中文乱码？

Question

保存的html文档中出现中文乱码：&lt;meta name="keywords" content="鈽呯敤閽㈢惔璇犻噴鍛ㄦ澃浼︹櫔鏃犱笌浼︽瘮涓嶉€濈粡鍏革紝姊︽兂瀹禯eDragon锛岄挗鐞达紝缁忓吀锛岃交闊充箰"&gt; 代码： {代码...} 1.使用...

黄舟 · Answer

Essayez ceci :

print(browser.page_source.encode('utf-8').decode(), file=open("xxx.html","w", encoding='utf-8'))

高洛峰 · Answer

print(browser.page_source,file=open('C:/Users/welwel/Desktop/source.html','w'))

高洛峰 · Answer

D'accord, mon besoin est d'explorer les commentaires et les titres des chansons. J'avais initialement prévu d'explorer la page Web et de la régulariser lentement. Plus tard, j'ai découvert que les pages Web impaires étaient normales en chinois, et les pages paires. les pages Web numérotées ont été tronquées (je veux les explorer. 50 pages Web), puis cela a été inversé. Cela signifie qu'il y a un bug sur Win7 et que Linux n'est pas installé. Utilisez l'analyse XPath selon les exigences,
par exemple :
ele_com = browser.find_element_by_xpath("//p[@class='cnt f-brk']")
Les données renvoyées sont normales. Fonctionne toujours sur cmd.
Donc, si vous souhaitez explorer des données, utilisez simplement les outils du module, ne plaisantez pas

Php8, je viens aussi

Apprenez la mise en page d'un site Web en 30 minutes

Tutoriel vidéo Shangguan Oracle débutant à compétent

Votre première ligne de code UNI-APP

Flutter de zéro au lancement de l'application

Brother Lian Nouveau didacticiel vidéo Linux

Tutoriel vidéo AXURE 9 (convient à l'interface utilisateur interactive de conception de produits du chef de produit)

Tutoriel vidéo PS Zero Basic Proficiency

Tutoriel vidéo de 16 jours sur l'interface utilisateur pour vous aider à démarrer

Tutoriel vidéo sur les techniques PS et les techniques de découpage

Tutoriel vidéo sur la construction et le lancement de projets d'Alibaba Cloud Environment

Présentation des réseaux informatiques - Connaissances de base que les programmeurs doivent maîtriser

Tutoriel essentiel pour les programmeurs - Explication du protocole HTTP

Tutoriel vidéo Websocket