연산자 연결을 사용하여 DataFrame 행 필터링
pandas는 다양한 작업(그룹화, 집계, 적용)에서 연산자 연결을 광범위하게 지원합니다. 이 방법을 통해 행을 필터링하는 기능은 제한적인 것으로 보입니다. 대신 사용자는 전통적으로 행 필터링에 대괄호 인덱싱을 사용해 왔습니다. 그러나 이 접근 방식을 사용하려면 DataFrame을 변수에 미리 할당해야 하므로 불편할 수 있습니다.
이러한 제한을 해결하기 위해 일부 사용자는 부울 인덱스 내에서 필터링 기준을 연결할 수 있는 가능성을 모색했습니다. 예를 들면 다음과 같습니다.
df[(df.A == 1) & (df.D == 6)]
이 구문을 사용하면 여러 조건을 결합하여 간결하고 효율적인 필터링이 가능합니다.
원하는 기능이 필터 기준 대신 메서드를 연결하는 것이라면 사용자는 사용자 정의 마스크를 정의할 수 있습니다. 기본 필터링 작업 주위에 메서드 래퍼 역할을 하는 메서드입니다.
def mask(df, key, value): return df[df[key] == value]
이 메서드를 DataFrame 클래스에 추가하면 다음과 같습니다.
pandas.DataFrame.mask = mask
그런 다음 사용자는 Pandas의 메서드 체이닝 기능을 활용할 수 있습니다. 한 줄의 코드로 여러 필터링 작업을 수행하려면:
df.mask('A', 1).mask('D', 6)
이 접근 방식은 DataFrames에서 필터링 작업을 연결하기 위한 사용자 정의 가능하고 유연한 솔루션을 제공합니다.
위 내용은 Pandas의 DataFrame 행 필터링에 연산자 연결을 사용할 수 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!