使用 pd.read_csv('somefile.csv') 时,您可能会遇到DtypeWarning 指示列具有混合类型。指定 dtype 选项可以防止此错误并提高性能。
已弃用的 low_memory 选项实际上不会影响行为。但是,它与 dtype 选项相关,因为猜测每列的 dtypes 可能会占用大量内存。
如果最后一行您的文件包含意外数据,指定数据类型可能会导致加载过程失败。例如,如果指定为整数的列包含类似“foobar”的字符串值,则加载将中断。
要避免此类错误,请显式读取 CSV 文件时指定 dtypes。使用 dtype 选项为每一列分配正确的数据类型,从而实现高效解析并减少内存消耗。
Pandas 支持各种 dtypes,包括:
Pandas 扩展:
以上是如何使用'dtype”和'low_memory”选项优化 Pandas'read_csv”?的详细内容。更多信息请关注PHP中文网其他相关文章!