Pandas iterrows의 성능 문제
행별 반복을 위한 pandas 함수인 iterrows에서 성능 결함이 나타나는 것으로 관찰되었습니다. 문제가 데이터 프레임의 혼합 dtype과 연결될 수 있지만 이 문제가 없는 간단한 시나리오에서도 상당한 성능 지연이 나타납니다.
적용과 같은 벡터화된 작업은 종종 반복 작업보다 성능이 뛰어나므로 행 단위의 필요성에 대한 의문이 제기됩니다. -행 반복. 그러나 iterrows가 불가피하게 남아 있는 경우도 있습니다.
Iterrows 성능 문제가 발생하는 이유
일반적으로 iterrows는 성능 특성상 벡터화, Apply, Itertuples보다 효율성이 떨어집니다. :
최적 성능을 위한 지침
성능을 최적화하려면 다음 지침을 고려하십시오.
위 내용은 Pandas 'iterrows'가 왜 이렇게 느린가요? 성능을 어떻게 향상시킬 수 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!