将 CSV 数据导入 NumPy 中的记录数组
使用表格数据时,记录数组可能是 NumPy 中有用的数据结构。它允许您存储具有异构数据类型的数据并使用字段名称访问数据。如果您正在寻找一种将 CSV 数据直接导入记录数组的方法,类似于 R 中的 read.table()、read.delim() 和 read.csv() 函数,这里有一个解决方案:
使用 numpy.genfromtxt()
NumPy 的 genfromtxt() 函数提供了直接读取的方式将 CSV 数据存储到记录数组中。通过将分隔符关键字参数设置为逗号,genfromtxt() 会自动将数据分隔成字段:
import numpy as np # Import CSV data using genfromtxt() data = np.genfromtxt("my_data.csv", delimiter=",")
生成的数据变量是一个结构化的 NumPy 数组,其中每行代表一条记录,每列代表一条记录代表一个字段。您可以使用类似属性的语法访问各个字段:
# Access the 'name' field names = data['name']
或者,您可以使用 dtype.names 属性将字段作为元组访问:
# Get the field names field_names = data.dtype.names # Access the 'name' field using the tuple index names = data[field_names.index('name')]
其他选项
如果您需要对数据导入过程进行更多控制,您可以使用pandas 库中的 pd.read_csv() 函数。它提供了额外的功能,例如处理不同的编码和跳过标题:
import pandas as pd # Import CSV data using pd.read_csv() df = pd.read_csv("my_data.csv")
无论您选择哪种方法,NumPy 的记录数组都提供了一种处理表格数据的便捷方法,而 genfromtxt() 提供了一种直接的方法将 CSV 数据导入此格式。
以上是如何将 CSV 数据导入 NumPy 记录数组?的详细内容。更多信息请关注PHP中文网其他相关文章!