Pandas DataFrames의 조건부 값 대체
Pandas DataFrames로 작업할 때 다음을 기반으로 조건부로 값을 대체해야 하는 상황이 발생할 수 있습니다. 지정된 조건. 이 질문은 사용자가 임계값을 초과하는 특정 열의 값을 0으로 바꾸려고 하는 시나리오를 보여줍니다.
처음에 사용자는 다음 접근 방식을 사용하려고 시도했습니다.
df[df.my_channel > 20000].my_channel = 0
그러나 이 방법은 아무런 결과도 얻지 못했습니다. 이는 Pandas가 버전 0.20.0부터 .ix 인덱서를 더 이상 사용하지 않기 때문에 사용자는 대신 .loc 또는 .iloc 인덱서를 사용해야 합니다.
올바른 해결책은 .loc 또는 .iloc를 사용하여 특정 행이나 열을 대상으로 하는 것입니다. 그리고 조건부 치환을 수행합니다. .loc를 사용하는 방법은 다음과 같습니다.
mask = df.my_channel > 20000 column_name = 'my_channel' df.loc[mask, column_name] = 0
또는 .loc를 사용하여 한 줄에서 동일한 작업을 수행할 수 있습니다.
df.loc[df.my_channel > 20000, 'my_channel'] = 0
마스크 변수는 다음을 충족하는 행을 식별하는 데 도움이 됩니다. 조건 df.my_channel > 20000, df.loc[mask, column_name] = 0은 지정된 열에서 선택한 행에 0을 할당합니다.
참고: 이 특정 시나리오에서는 대신 .loc를 사용하는 것이 좋습니다. .iloc를 사용한 정수 기반 부울 인덱싱은 지원되지 않으므로 NotImplementedError를 방지하기 위해 .iloc를 사용합니다.
위 내용은 Pandas DataFrame 열의 값을 조건부로 바꾸는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!