Pandas로 CSV 가져오기 중 행 건너뛰기
Pandas를 사용하여 CSV 데이터를 가져올 때 원하지 않는 행을 건너뛰어야 하는 경우가 많습니다. 분석에 포함시키세요. 그러나 Skiprows 인수를 둘러싼 모호성은 혼란스러울 수 있습니다.
skiprows의 구문은 다음과 같습니다.
skiprows : list-like or integer Row numbers to skip (0-indexed) or number of rows to skip (int) at the start of the file.
질문이 생깁니다. Pandas는 첫 번째 행을 건너뛸지 또는 건너뛸지 여부를 어떻게 알 수 있습니까? Skipping the Rows=1이 지정된 경우 인덱스 1이 있는 행은 무엇입니까?
이 문제를 풀기 위해 3개의 행이 있는 샘플 CSV 파일을 사용하여 실험을 수행해 보겠습니다.
1, 2 3, 4 5, 6
행 건너뛰기 인덱스 1
인덱스 1이 있는 행을 건너뛰려면 Skiprows를 목록으로 전달하세요.
<code class="python">import pandas as pd from io import StringIO s = """1, 2 ... 3, 4 ... 5, 6""" df = pd.read_csv(StringIO(s), skiprows=[1], header=None) # Skip row with index 1 print(df)</code>
출력:
0 1 0 1 2 1 5 6
행 개수 건너뛰기
특정 행 수(이 경우 1)를 건너뛰려면 Skiprows를 정수로 전달하세요.
<code class="python">df = pd.read_csv(StringIO(s), skiprows=1, header=None) # Skip the first row print(df)</code>
출력:
0 1 0 3 4 1 5 6
따라서 Skiprows 인수는 목록을 제공하는지 정수를 제공하는지에 따라 다르게 동작하는 것이 분명합니다. 인덱스를 기준으로 행을 건너뛰려면 목록을 사용하세요. 그렇지 않으면 정수를 사용하여 파일 시작 부분에서 지정된 수의 행을 건너뜁니다.
위 내용은 Pandas의 `skiprows`는 첫 번째 행을 건너뛸지 아니면 인덱스 1이 있는 행을 건너뛸지 어떻게 알 수 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!