ホームページ > バックエンド開発 > Python チュートリアル > Python処理中国語エンコードと判定エンコード例

Python処理中国語エンコードと判定エンコード例

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB
リリース: 2016-06-16 08:45:04
オリジナル
1137 人が閲覧しました

以下はすべて Python2.7 用です

コードをコピー コードは次のとおりです:

#coding:utf-8
#chardet をダウンロードする必要がありますそしてインストールされました

import chardet
#Catch webpage html
line = "http://www.***.com"
html_1 = urllib2.urlopen(line,timeout=120).read()
#print html_1
encoding_dict = chardet.detect(html_1)
#print encoding
web_encoding = encoding_dict['encoding']
if web_encoding == 'utf-8' または web_encoding == ' UTF-8':

html = html_1
else :
html = html_1.decode('gbk','ignore').encode('utf-8')

#上記の処理により、html全体が文字化けすることはありません。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート