Pandas로 CSV를 가져오는 동안 행 건너뛰기
pandas.read_csv()를 사용하여 CSV 데이터를 가져올 때 특정 행을 건너뛸 수 있습니다. . 그러나 Skiprows 매개변수는 목록과 정수를 모두 허용하므로 혼동될 수 있습니다.
skiprows 매개변수를 사용하면 파일 시작 부분에서 건너뛸 행을 지정할 수 있습니다. 행 번호 목록을 제공하면 해당 행을 건너뜁니다. 정수를 제공하면 해당 행 수를 건너뜁니다.
예를 들어 두 번째 행에 불필요한 데이터가 포함된 CSV 파일이 있고 이를 건너뛰려는 경우 다음 중 하나를 사용할 수 있습니다. 방법:
목록으로 건너뛰기(권장)
<code class="python">import pandas as pd from io import StringIO s = """1, 2 3, 4 5, 6""" # Skip the second row using a list df = pd.read_csv(StringIO(s), skiprows=[1], header=None) # Output: Row with index 1 skipped print(df)</code>
정수로 건너뛰기
<code class="python"># Skip the second row using an integer df = pd.read_csv(StringIO(s), skiprows=1, header=None) # Output: Row with index 1 skipped print(df)</code>
참고 Skiprows=1을 사용하면 첫 번째 행을 건너뛰고, Skiprows=[1]을 사용하면 인덱스가 1인 행을 건너뜁니다. 이는 Python이 목록의 첫 번째 요소에 인덱스가 0인 0 기반 인덱싱을 사용하기 때문입니다.
결론
skiprows 매개변수의 동작을 이해하면 Pandas를 사용하여 CSV를 가져오는 동안 원하지 않는 행을 효과적으로 건너뛸 수 있습니다.
위 내용은 Pandas CSV 가져오기에서 행을 건너뛰는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!