In diesem Artikel werden hauptsächlich relevante Informationen zur Verwendung von Python zum Erhalten des Implementierungscodes für die Webseitenkodierungsmethode vorgestellt. Freunde in Not können sich auf
Python beziehen, um die Webseite zu erhalten Codierungsmethode-Implementierungscode
<span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);"> </span><span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);"> python开发,自动化获取网页编码方式用到了chardet库,字符集检测,这个类在python2.7中没有,需要在官网上下载。 这里我下载好了chardet-2.3.0.tar.gz压缩包文件,只需要将压缩包文件解压后的chardet文件放到python安装包下的 python27/lib/site-packages/下,就可以了。</span>
Dann importieren Sie Chardet
und schreiben Sie eine automatische Erkennung Funktion für Erkennt URL-Verbindungen und gibt dann die Codierungsmethode der Webseiten-URL zurück.
import chardet #字符集检测 import urllib url="http://www.jd.com" def automatic_detect(url): content=urllib.urlopen(url).read() result=chardet.detect(content) encoding=result['encoding'] return encoding urls=['http://www.baidu.com','http://www.163.com','http://dangdang.com'] for url in urls: print url,automatic_detect(url)
Das Obige verwendet die Erkennungsmethode der Chardet-Klasse, gibt das Wörterbuch zurück und nimmt dann die Kodierungsmethodenkodierung heraus
Vielen Dank fürs Lesen, ich hoffe, es hilft. Vielen Dank an alle für die Unterstützung dieser Website!
Das obige ist der detaillierte Inhalt vonVerwenden Sie Python, um den Implementierungscode für die Webseitenkodierungsmethode abzurufen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!