Python 中读取 CSV 数据的方法分两种:内置 csv 模块,适用于小型 CSV 文件,按行迭代数据;Pandas 库,提供 read_csv() 函数,可轻松将 CSV 数据加载到 DataFrame 中进行处理。
Python 读取 CSV 数据的实用技巧分享
在数据科学和机器学习中,我们经常需要从 CSV(逗号分隔值)文件中读取数据。Python 提供了几个用于此目的的内置函数和库。本教程将探讨 Python 读取 CSV 数据的不同方法,并提供实战案例。
内置函数
对于小型 CSV 文件,我们可以使用内置的 csv
模块。它提供了一个 [reader()
](https://docs.python.org/3/library/csv.html#csv.reader) 函数,用于按行迭代 CSV 数据。
import csv with open('data.csv', 'r') as file: reader = csv.reader(file) for row in reader: # 处理每一行数据
Pandas 库
Pandas 是用于数据分析和操作的流行库。它提供了一个 [read_csv()
](https://pandas.pydata.org/docs/reference/api/pandas.read_csv.html) 函数,可以轻松地将 CSV 数据加载到 DataFrame 中。DataFrame 是一种类似于表格的数据结构,易于处理和操作。
import pandas as pd df = pd.read_csv('data.csv') # 访问 DataFrame 中的数据
实战案例
考虑一个名为 data.csv
的 CSV 文件,其中包含以下数据:
name,age John,25 Jane,30
使用内置函数读取数据:
import csv with open('data.csv', 'r') as file: reader = csv.reader(file) for row in reader: print(row)
输出:
['name', 'age'] ['John', '25'] ['Jane', '30']
使用 Pandas 库读取数据:
import pandas as pd df = pd.read_csv('data.csv') print(df)
输出:
name age 0 John 25 1 Jane 30
结语
通过使用内置功能或 Pandas 库,我们可以轻松地从 CSV 文件中读取数据。这些技术在处理小型和大型 CSV 文件时都非常有用。选择方法取决于特定数据集的大小和复杂性。
以上是Python读取CSV数据的实用技巧分享的详细内容。更多信息请关注PHP中文网其他相关文章!