Pandas DataFrame 행을 효율적으로 반복하려면 어떻게 해야 합니까?-파이썬 튜토리얼-php.cn

Pandas DataFrame 행을 효율적으로 반복하려면 어떻게 해야 합니까?

Mary-Kate Olsen

풀어 주다： 2024-12-27 20:00:18

원래의

745명이 탐색했습니다.

How Can I Efficiently Iterate Through Pandas DataFrame Rows?

Pandas DataFrame 행 순회

Pandas DataFrame의 행에 대한 반복은 표 형식 데이터를 조작할 때 일반적으로 발생합니다. 이 기사에서는 이 작업을 수행하는 두 가지 방법을 탐색하고 행 객체의 구성을 조명합니다.

iterrows() 사용

Pandas는 인덱스와 행을 모두 반환하는 효율적인 DataFrame.iterrows 생성기를 제공합니다. 각 관찰에 대한 시리즈로. 이 방법을 사용하면 행의 인덱스를 사용하여 열 값에 직접 액세스할 수 있습니다.

import pandas as pd
 
df = pd.DataFrame({'c1': [10, 11, 12], 'c2': [100, 110, 120]})
 
for index, row in df.iterrows():
    print(row['c1'], row['c2'])

로그인 후 복사

이 스니펫 출력은 다음과 같습니다.

100
110
120

로그인 후 복사

성능 고려 사항에 대한 참고

Pandas 객체를 반복하는 동안 일반적으로 편리한 접근 방식이지만 벡터화된 작업에 비해 속도가 느릴 수 있습니다. 성능을 최대화하려면 다음과 같은 대체 기술을 고려하십시오.

벡터화된 계산을 위해 내장된 메서드 및 NumPy 함수를 활용합니다.
효율적인 데이터 하위 집합을 위해 부울 인덱싱을 활용합니다.
직접 수정이 필요한 반복 작업에는 apply()를 사용합니다. 필요합니다.
cython 또는 numba를 사용하여 성능이 중요한 루프를 최적화합니다.

추가 반복 방법

iterrows() 외에도 Pandas는 다음과 같은 다른 행 반복 방법을 제공합니다. as:

itertuples(): 각 행에 대해 명명된 튜플을 반환합니다.
iterrows(ignore_index=True): 반복 행을 제외하고 index.
itertuples(ignore_index=True): itertuples()와 유사하지만 인덱스를 제외합니다.

위 내용은 Pandas DataFrame 행을 효율적으로 반복하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!