使用 Pandas 导入 CSV 时跳过行
使用 Pandas 导入 CSV 数据时,通常需要跳过不需要的行包含在您的分析中。然而,围绕skiprows参数的歧义可能会令人困惑。
skiprows的语法如下:
skiprows : list-like or integer Row numbers to skip (0-indexed) or number of rows to skip (int) at the start of the file.
问题出现了:Pandas如何知道是否跳过第一行或当指定skiprows=1 时索引为1 的行?
为了解决这个问题,让我们使用包含三行的示例 CSV 文件执行一个实验:
1, 2 3, 4 5, 6
跳过行索引为 1
如果要跳过索引为 1 的行,请将跳行作为列表传递:
<code class="python">import pandas as pd from io import StringIO s = """1, 2 ... 3, 4 ... 5, 6""" df = pd.read_csv(StringIO(s), skiprows=[1], header=None) # Skip row with index 1 print(df)</code>
输出:
0 1 0 1 2 1 5 6
跳过行数
要跳过特定数量的行(在本例中为 1),请将skiprows 作为整数传递:
<code class="python">df = pd.read_csv(StringIO(s), skiprows=1, header=None) # Skip the first row print(df)</code>
输出:
0 1 0 3 4 1 5 6
因此,很明显,skiprows 参数的行为会有所不同,具体取决于您提供的是列表还是整数。如果您想按索引跳过一行,请使用列表。否则,使用整数从文件开头跳过指定行数。
以上是Pandas 中的'skiprows”如何知道是否要跳过第一行或索引为 1 的行?的详细内容。更多信息请关注PHP中文网其他相关文章!