使用 Pandas 进行 CSV 导入时跳过行
使用 pandas.read_csv() 导入 CSV 数据时,您可能想要跳过某些行。但是,skiprows 参数可能会令人困惑,因为它同时接受列表和整数。
skiprows 参数允许您指定要从文件开头跳过的行。如果您提供行号列表,它将跳过这些行。如果您提供一个整数,它将跳过该行数。
例如,如果您有一个 CSV 文件,其中第二行包含不必要的数据并且您想要跳过它,您可以使用以下任意一种方法:
Skiprow 作为列表(推荐)
<code class="python">import pandas as pd from io import StringIO s = """1, 2 3, 4 5, 6""" # Skip the second row using a list df = pd.read_csv(StringIO(s), skiprows=[1], header=None) # Output: Row with index 1 skipped print(df)</code>
Skiprow 作为整数
<code class="python"># Skip the second row using an integer df = pd.read_csv(StringIO(s), skiprows=1, header=None) # Output: Row with index 1 skipped print(df)</code>
注意使用skiprows=1 会跳过第一行,而skiprows=[1] 会跳过索引为1 的行。这是因为Python 使用基于0 的索引,其中列表中的第一个元素的索引为0。
结论
通过了解skiprows参数的行为,您可以在使用pandas导入CSV期间有效地跳过不需要的行。
以上是如何在 Pandas CSV 导入中跳过行?的详细内容。更多信息请关注PHP中文网其他相关文章!