ホームページ バックエンド開発 Python チュートリアル Python で Unicode (UTF-8) ファイルを正しく読み書きするにはどうすればよいですか?

Python で Unicode (UTF-8) ファイルを正しく読み書きするにはどうすればよいですか?

Nov 05, 2024 am 02:35 AM

How Can I Read and Write Unicode (UTF-8) Files Correctly in Python?

Python での Unicode (UTF-8) ファイル I/O

Python では、ファイル内の Unicode テキストの処理にはエンコードとデコードの操作が含まれます。ただし、一般的な問題に例示されるように、これらの概念を理解するのは難しい場合があります:

デコードの混乱:

Python 2.4 の次のコードを考えてみましょう:

<code class="python">ss = u'Capit\xe1n'
ss8 = ss.encode('utf8')
print(ss, ss8)</code>
ログイン後にコピー

このコードの出力:

Capit\xe1n b'Capit\xc3\xa1n'
ログイン後にコピー

a 鋭文字 (á) は、Unicode (u'Capitxe1n') と UTF-8 (ss8 = 'Capitxc3xa1n') では異なって表されます。 ss8 を出力する場合、Python はデフォルトで ASCII 表現を使用するため、xc3xa1n シーケンスになります。

ファイル 'f1' を書き込みモードで開き、それに ss8 を書き込むと、'Capitxc3xa1nn' がファイルに書き込まれます。逆に、SS を別のファイル 'f2' に書き込む場合、Python は a-acute 文字をエスケープ シーケンスとして解釈しようとします。その結果、'Capitxc3xa1nn' が生成されます。

デコード ソリューション:

この混乱を解決するには、ファイルを開くときにエンコーディングを明示的に指定します。 Python 2.6 以降では、io.open 関数を使用できます。

<code class="python">import io
f = io.open("test", mode="r", encoding="utf-8")</code>
ログイン後にコピー

このアプローチにより、ファイルは確実に UTF-8 で読み書きされ、手動でのエンコードとデコードの必要がなくなります。 Python 3.x では、io.open 関数は組み込み open 関数のエイリアスであり、エンコーディング引数もサポートしています。

代わりに、コーデック モジュールを使用することもできます。

<code class="python">import codecs
f = codecs.open("test", "r", "utf-8")</code>
ログイン後にコピー

codecs.open を使用するときに read() メソッドと readline() メソッドを混在させると問題が発生する可能性があることに注意することが重要です。

以上がPython で Unicode (UTF-8) ファイルを正しく読み書きするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットな記事タグ

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

HTMLを解析するために美しいスープを使用するにはどうすればよいですか? HTMLを解析するために美しいスープを使用するにはどうすればよいですか? Mar 10, 2025 pm 06:54 PM

HTMLを解析するために美しいスープを使用するにはどうすればよいですか?

Pythonでファイルをダウンロードする方法 Pythonでファイルをダウンロードする方法 Mar 01, 2025 am 10:03 AM

Pythonでファイルをダウンロードする方法

Pythonでの画像フィルタリング Pythonでの画像フィルタリング Mar 03, 2025 am 09:44 AM

Pythonでの画像フィルタリング

Pythonを使用してテキストファイルのZIPF配布を見つける方法 Pythonを使用してテキストファイルのZIPF配布を見つける方法 Mar 05, 2025 am 09:58 AM

Pythonを使用してテキストファイルのZIPF配布を見つける方法

Pythonを使用してPDFドキュメントの操作方法 Pythonを使用してPDFドキュメントの操作方法 Mar 02, 2025 am 09:54 AM

Pythonを使用してPDFドキュメントの操作方法

DjangoアプリケーションでRedisを使用してキャッシュする方法 DjangoアプリケーションでRedisを使用してキャッシュする方法 Mar 02, 2025 am 10:10 AM

DjangoアプリケーションでRedisを使用してキャッシュする方法

TensorflowまたはPytorchで深い学習を実行する方法は? TensorflowまたはPytorchで深い学習を実行する方法は? Mar 10, 2025 pm 06:52 PM

TensorflowまたはPytorchで深い学習を実行する方法は?

Pythonで独自のデータ構造を実装する方法 Pythonで独自のデータ構造を実装する方法 Mar 03, 2025 am 09:28 AM

Pythonで独自のデータ構造を実装する方法

See all articles