Pandas의 부울 인덱싱을 위한 논리 연산자
Pandas에서 부울 인덱싱을 사용할 때 논리 연산자 간의 차이점을 이해하는 것이 중요합니다." &" 그리고 "and".
질문: 다음 명령문은 오류 없이 작동하는 이유는 무엇입니까?
a[(a['some_column']==some_number) & (a['some_other_column']==some_other_number)]
그러나 다음 명령문은 오류와 함께 종료됩니다.
a[(a['some_column']==some_number) and (a['some_other_column']==some_other_number)]
정답:
Python의 "and" 연산자는 피연산자를 암시적으로 부울 값으로 변환합니다. 그러나 NumPy 배열(및 NumPy 배열을 기반으로 하는 Pandas 시리즈)을 처리할 때 이 변환은 모호성을 초래할 수 있습니다.
여러 요소가 포함된 배열의 진리값을 평가할 때 이를 사용해야 하는지 여부가 불분명합니다. 다음과 같은 경우 True로 간주됩니다.
이 모호함을 피하기 위해 NumPy와 Pandas는 "any()", "all()", 또는 "empty()" 메소드.
부울 인덱싱의 경우 부울 평가를 원하지 않고 오히려 요소별 논리 연산. 여기서 "&" 연산자가 사용됩니다.
"&" 연산자는 요소별 논리 AND 연산을 수행합니다. 각 요소가 입력 배열에 있는 해당 요소의 논리적 AND 결과인 부울 배열을 반환합니다.
예:
import pandas as pd a = pd.DataFrame({'x':[1,1],'y':[10,20]}) print(a[(a['x']==1) & (a['y']==10)])
출력:
x y 0 1 10
이 예에서는 "&" 연산자를 사용하여 "x" 열과 "x" 열이 모두 있는 행을 찾습니다. "y" 열이 지정된 기준을 충족합니다.
위 내용은 Pandas 부울 인덱싱: 'and' 대신 '&'를 사용하는 이유는 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!