Cet article présente principalement les informations pertinentes sur l'utilisation de python pour obtenir le code d'implémentation de la méthode d'encodage de page Web. Les amis dans le besoin peuvent se référer à
python pour obtenir la page Web. code d'implémentation de la méthode d'encodage
<span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);"> </span><span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);"> python开发,自动化获取网页编码方式用到了chardet库,字符集检测,这个类在python2.7中没有,需要在官网上下载。 这里我下载好了chardet-2.3.0.tar.gz压缩包文件,只需要将压缩包文件解压后的chardet文件放到python安装包下的 python27/lib/site-packages/下,就可以了。</span>
Puis importez chardet
et ci-dessous j'ai écrit une fonction de détection automatisée pour détecter les connexions URL, puis renvoie la méthode de codage de l'URL de la page Web.
import chardet #字符集检测 import urllib url="http://www.jd.com" def automatic_detect(url): content=urllib.urlopen(url).read() result=chardet.detect(content) encoding=result['encoding'] return encoding urls=['http://www.baidu.com','http://www.163.com','http://dangdang.com'] for url in urls: print url,automatic_detect(url)
Ce qui précède utilise la méthode de détection de la classe chardet, renvoie le dictionnaire, puis supprime la méthode d'encodage encoding
Merci d'avoir lu, j'espère que cela vous aidera. À tous, merci pour votre soutien à ce site !
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!