Pandas의 효율적인 DataFrame 행 반복
DataFrame 행 반복은 데이터 분석에서 일반적인 작업입니다. 이 문서에서는 DataFrame.T.iteritems() 및 DataFrame.iterrows()라는 두 가지 방법을 살펴보고 행 객체와 그 사용법에 대한 명확한 설명을 제공합니다.
행 객체
DataFrame.iterrows()에서 반환된 행 개체는 DataFrame의 단일 행을 나타내는 시리즈입니다. 열 이름으로 개별 셀 값에 대한 액세스를 제공합니다.
for index, row in df.iterrows(): print(row['c1'], row['c2'])
예
다음 DataFrame을 고려하세요.
c1 | c2 |
---|---|
10 | 100 |
11 | 110 |
12 | 120 |
위의 방법을 사용하는 행은 다음을 생성합니다 출력:
10 100 11 110 12 120
성능 고려 사항
DataFrame 행을 반복하는 것은 계산 집약적일 수 있다는 점에 유의하는 것이 중요합니다. 문서에서는 성능 병목 현상을 피하기 위해 가능할 때마다 벡터화된 작업이나 apply() 함수를 사용할 것을 권장합니다.
Iterrows의 대안
고급 작업의 경우 다음을 사용하는 것이 좋습니다. iter* 함수의 대안:
행 객체 작업 방법을 이해하고 성능에 미치는 영향을 고려하여, DataFrame 행을 효과적으로 반복하여 다양한 데이터 분석 작업을 수행할 수 있습니다.
위 내용은 Pandas DataFrame 행을 반복하는 효율적인 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!