Python 中讀取CSV 資料的方法分成兩種:內建csv 模組,適用於小型CSV 文件,按行迭代資料;Pandas 函式庫,提供read_csv() 函數,可輕鬆將CSV 資料載入到DataFrame 中進行處理。
Python 讀取CSV 資料的實用技巧分享
在資料科學和機器學習中,我們經常需要從CSV(逗號分隔值)檔案中讀取資料。 Python 提供了幾個用於此目的的內建函數和函式庫。本教學將探討 Python 讀取 CSV 資料的不同方法,並提供實戰案例。
內建函數
對於小型 CSV 文件,我們可以使用內建的 csv
模組。它提供了一個 [reader()
](https://docs.python.org/3/library/csv.html#csv.reader) 函數,用於按行迭代 CSV 資料。
import csv with open('data.csv', 'r') as file: reader = csv.reader(file) for row in reader: # 处理每一行数据
Pandas 函式庫
Pandas 是用於資料分析和操作的流行函式庫。它提供了一個[read_csv()
](https://pandas.pydata.org/docs/reference/api/pandas.read_csv.html) 函數,可以輕鬆地將CSV 資料載入到DataFrame 中。 DataFrame 是一種類似表格的資料結構,易於處理和操作。
import pandas as pd df = pd.read_csv('data.csv') # 访问 DataFrame 中的数据
實戰案例
考慮一個名為data.csv
的CSV 文件,其中包含以下資料:
name,age John,25 Jane,30
#使用內建函數讀取資料:
import csv with open('data.csv', 'r') as file: reader = csv.reader(file) for row in reader: print(row)
輸出:
['name', 'age'] ['John', '25'] ['Jane', '30']
使用Pandas 函式庫讀取資料:
import pandas as pd df = pd.read_csv('data.csv') print(df)
輸出:
name age 0 John 25 1 Jane 30
結語
透過使用內建功能或Pandas 函式庫,我們可以輕鬆地從CSV 檔案中讀取資料。這些技術在處理小型和大型 CSV 檔案時都非常有用。選擇方法取決於特定資料集的大小和複雜性。
以上是Python讀取CSV資料的實用技巧分享的詳細內容。更多資訊請關注PHP中文網其他相關文章!