Utilisez Python pour obtenir le code d'implémentation de la méthode de codage de page Web

高洛峰
Libérer: 2017-03-13 09:41:07
original
1666 Les gens l'ont consulté

Cet article présente principalement les informations pertinentes sur l'utilisation de python pour obtenir le code d'implémentation de la méthode d'encodage de page Web. Les amis dans le besoin peuvent se référer à

python pour obtenir la page Web. code d'implémentation de la méthode d'encodage


<span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">
   </span><span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">
python开发,自动化获取网页编码方式用到了chardet库,字符集检测,这个类在python2.7中没有,需要在官网上下载。
这里我下载好了chardet-2.3.0.tar.gz压缩包文件,只需要将压缩包文件解压后的chardet文件放到python安装包下的
python27/lib/site-packages/下,就可以了。</span>
Copier après la connexion

Puis importez chardet

et ci-dessous j'ai écrit une fonction de détection automatisée pour détecter les connexions URL, puis renvoie la méthode de codage de l'URL de la page Web.


import chardet #字符集检测 
import urllib 
 
url="http://www.jd.com" 
 
 
def automatic_detect(url): 
  content=urllib.urlopen(url).read() 
  result=chardet.detect(content) 
 
  encoding=result[&#39;encoding&#39;] 
 
  return encoding 
 
urls=[&#39;http://www.baidu.com&#39;,&#39;http://www.163.com&#39;,&#39;http://dangdang.com&#39;] 
for url in urls: 
  print url,automatic_detect(url)
Copier après la connexion

Ce qui précède utilise la méthode de détection de la classe chardet, renvoie le dictionnaire, puis supprime la méthode d'encodage encoding

Merci d'avoir lu, j'espère que cela vous aidera. À tous, merci pour votre soutien à ce site !

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal