嘗試使用 Python 讀取包含特殊字元的 CSV 檔案時,遇到異常。該程式碼利用編碼和解碼在 ASCII 和 UTF-8 之間進行轉換,但這種方法仍然會產生錯誤。
原始程式碼錯誤地使用了 .encode 方法,將其應用於位元組字串而不是 Unicode 字串。要解決此問題,可以使用以下簡化程式碼:
<code class="python">import csv def unicode_csv_reader(utf8_data, dialect=csv.excel, **kwargs): csv_reader = csv.reader(utf8_data, dialect=dialect, **kwargs) for row in csv_reader: yield [unicode(cell, 'utf-8') for cell in row] filename = 'da.csv' reader = unicode_csv_reader(open(filename)) for field1, field2, field3 in reader: print field1, field2, field3 </code>
此程式碼可以有效地將 UTF-8 編碼的資料讀取到 Python 清單中,而無需進行轉碼。
以上是如何使用 Python 讀取 UTF-8 CSV 檔案而不出現編碼錯誤?的詳細內容。更多資訊請關注PHP中文網其他相關文章!