如何在 Python 中讀取重音字元的 UTF8 CSV 檔案?

Susan Sarandon
發布: 2024-11-03 00:40:29
原創
285 人瀏覽過

How to Read a UTF8 CSV File with Accented Characters in Python?

使用Python 讀取UTF8 CSV 檔案

嘗試使用Python(特別是西班牙文或法文)讀取包含重音字元的CSV 檔案時,由於Python 的其csvreader 內預設支援ASCII。

為了解決此問題,建議修改程式碼片段來讀取 CSV 文件,如下所示:

<code class="python">import csv

def unicode_csv_reader(utf8_data, dialect=csv.excel, **kwargs):
    csv_reader = csv.reader(utf8_data, dialect=dialect, **kwargs)
    for row in csv_reader:
        yield [unicode(cell, 'utf-8') for cell in row]

filename = 'output.csv'
reader = unicode_csv_reader(open(filename))
for field1, field2, field3 in reader:
    ...</code>
登入後複製

此程式碼假設輸入資料已採用 UTF 格式-8編碼。如果輸入資料採用不同的編碼,則可以應用以下「轉碼」方法:

<code class="python">line.decode('whateverweirdcodec').encode('utf-8')</code>
登入後複製

透過將'whateverweirdcodec' 替換為適當的編碼,可以將輸入資料轉換為UTF-8正在被csvreader讀取。

以上是如何在 Python 中讀取重音字元的 UTF8 CSV 檔案?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板