コミュニティ

学ぶ

ツールライブラリ

AIツール

レジャー

日本語

ホームページ > バックエンド開発 > Python チュートリアル > Pythonで中国語の文字化けを収集する方法

Pythonで中国語の文字化けを収集する方法

高洛峰

リリース： 2017-02-24 15:31:42

オリジナル

1554 人が閲覧しました

ここ数日、あるウェブページを収集したところ、ほとんどのウェブページは正常でしたが、少数のウェブページで文字化けが発生していました。数日間デバッグした結果、一部の不正な文字が原因であることが判明しました。これは記録されています

1. 通常の状況では...

import chardet

thischarset = chardet.detect(strs)["encoding"]

ログイン後にコピー

を使用してファイルまたはページのエンコード方法を取得するか、ページのcharset = xxxxを直接取得できます。

を取得する 2. コンテンツ内で特殊文字が発生した場合に指定します。これは、コンテンツ内の不正な文字によっても発生します。これは、不正な文字を無視するようにエンコードすることで処理できます。 decode の 2 番目のパラメータは、不正な文字が検出されたときに採用されるメソッドを示します。

このパラメータはデフォルトで例外をスローします。

上記は、エディタによってもたらされた Python の中国語文字化けコレクションの問題に対する完璧な解決策であることを願っています。 PHP 中国語 Web サイトをサポートしてください

詳細 Python を使用して中国語の文字化けを収集する方法に関する関連記事は、PHP 中国語 Web サイトに注目してください。

関連ラベル：

python 中文乱码

前の記事：VLAN 全体での Python ブラックハットプログラミング 3.4 次の記事：Python を飛ばすための 20 のヒント

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

著者別の最新記事

HTMLで太字、斜体、下線、取り消し線などのフォント効果を設定する例の紹介

1970-01-01 08:00:00
Java バージョンの Redis を実装する

1970-01-01 08:00:00
最も単純な WeChat アプレットのデモ

1970-01-01 08:00:00
Pythonでのpandas.DataFrameの簡単な操作方法（作成、インデックス、追加、削除）の紹介

1970-01-01 08:00:00
WeChat ミニプログラム: タブ効果の実装方法の例

1970-01-01 08:00:00
Python は辞書構造の出力を美しくするためのカスタムメソッドを構築します

1970-01-01 08:00:00
HTML5: Canvas を使用してビデオをリアルタイムで処理する

1970-01-01 08:00:00
Asp.net は SignalR を使用して画像を送信します

1970-01-01 08:00:00
WeChat ミニプログラム開発チュートリアル - App() および Page() 関数の概要

1970-01-01 08:00:00
Python Redisの使い方を詳しく解説

1970-01-01 08:00:00

最新の問題

Pythonの中国語文字化け問題

から 1970-01-01 08:00:00

0

0

0

python3.x - バッチ起動コマンドを使用して指定した Python スクリプトを実行する場合、Python スクリプトのパスまたは名前に漢字が含まれていると実行できません。

から 1970-01-01 08:00:00

0

0

0

データマイニング - Python を使用して「複数のソーシャルネットワークの影響力最大化問題の分析」のアルゴリズムを実装するにはどうすればよいですか?

から 1970-01-01 08:00:00

0

0

0

Python - 文字列内のすべての中国語文字を正規化する方法

から 1970-01-01 08:00:00

0

0

0

JavaScript - 中国語と Python の js MD5 暗号化の結果は異なります。

から 1970-01-01 08:00:00

0

0

0

関連トピック

詳細>

人気のおすすめ

人気のチュートリアル

詳細>

関連するチュートリアル

人気のおすすめ

最新のコース

最新のダウンロード

詳細>

ウェブエフェクト

公式サイト

サイト素材

フロントエンドテンプレート