Python dispose de quatre méthodes pour lire le chinois : lire directement, spécifier l'encodage, traiter les caractères d'échappement et utiliser des bibliothèques tierces. Lisez directement les fichiers adaptés à l'encodage UTF-8 par défaut, spécifiez l'encodage pour spécifier l'encodage non UTF-8, gérez les caractères d'échappement pour gérer les caractères d'échappement et les bibliothèques tierces peuvent détecter automatiquement l'encodage des fichiers.
Comment lire le chinois en Python
Lecture directe :
Le codage Unicode est pris en charge par défaut dans Python 3, les fichiers chinois peuvent donc être lus directement.
<code class="python">with open('test.txt', 'r', encoding='utf-8') as f: text = f.read() print(text)</code>
Spécifiez l'encodage :
Si le fichier n'est pas l'encodage UTF-8 par défaut, vous devez spécifier le format d'encodage correct.
<code class="python">with open('test.txt', 'r', encoding='gbk') as f: text = f.read() print(text)</code>
Traitement des caractères d'échappement :
Si le fichier chinois contient des caractères d'échappement (par exemple, uxxxx
), vous devez utiliser le module codecs
pour le traitement. uxxxx
),需要使用codecs
模块进行处理。
<code class="python">import codecs with codecs.open('test.txt', 'r', encoding='utf-8') as f: text = f.read() print(text)</code>
使用第三方库:
一些第三方库,如chardet
和universal-encoding-detector
<code class="python">import chardet with open('test.txt', 'rb') as f: text = f.read() encoding = chardet.detect(text)['encoding'] print(encoding)</code>
Utilisez des bibliothèques tierces :
Certaines bibliothèques tierces, telles quechardet
et universal-encoding-detector
, peuvent détecter automatiquement l'encodage des fichiers. Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!