Python 讀取中文有四種方法:直接讀取、指定編碼、處理轉義字元和使用第三方函式庫。直接讀取適用於預設 UTF-8 編碼的文件,指定編碼可指定非 UTF-8 編碼,處理轉義字符可處理轉義字符,第三方庫可自動檢測文件編碼。
Python如何讀取中文
直接讀取:
#Python 3中預設支援Unicode編碼,因此可以直接讀取中文檔案。
<code class="python">with open('test.txt', 'r', encoding='utf-8') as f: text = f.read() print(text)</code>
指定編碼:
如果檔案不是預設的UTF-8編碼,則需要指定正確的編碼格式。
<code class="python">with open('test.txt', 'r', encoding='gbk') as f: text = f.read() print(text)</code>
處理轉義字元:
如果中文檔案包含轉義字元(例如,\uxxxx
),需要使用codecs
模組進行處理。
<code class="python">import codecs with codecs.open('test.txt', 'r', encoding='utf-8') as f: text = f.read() print(text)</code>
使用第三方函式庫:
某些第三方函式庫,如chardet
和universal-encoding-detector
#,可以自動檢測文件編碼。
<code class="python">import chardet with open('test.txt', 'rb') as f: text = f.read() encoding = chardet.detect(text)['encoding'] print(encoding)</code>
其他注意事項:
以上是python怎麼讀取中文的詳細內容。更多資訊請關注PHP中文網其他相關文章!