> 백엔드 개발 > 파이썬 튜토리얼 > Pandas에서 연결된 할당의 결과를 언제 명시적으로 할당해야 합니까?

Pandas에서 연결된 할당의 결과를 언제 명시적으로 할당해야 합니까?

Patricia Arquette
풀어 주다: 2024-10-24 06:28:30
원래의
468명이 탐색했습니다.

When Should I Explicitly Assign Results from Chained Assignments in Pandas?

Pandas 연결 할당이 명확해짐

Pandas의 연결 할당 개념은 혼란스러울 수 있으며, 특히 SettingWithCopy 경고가 발생할 때 더욱 그렇습니다. 이 동작이 어떻게 작동하는지, 그리고 .ix(), .iloc() 또는 .loc() 사용이 미치는 영향을 살펴보겠습니다.

연결된 할당 이해

연결된 할당을 사용하는 경우 할당이 원본 데이터 프레임이 아닌 데이터의 사본에서 수행될 가능성이 높다는 점을 인식하는 것이 중요합니다. 이로 인해 데이터를 수정하지 않은 채로 두는 등 의도하지 않은 결과가 발생할 수 있습니다.

이 문제를 방지하려면 연결된 작업의 결과를 원래 열에 명시적으로 다시 할당하는 것이 좋습니다. 예를 들면 다음과 같습니다.

<code class="python">data["amount"] = data["amount"].fillna(data.groupby("num")["amount"].transform("mean"))</code>
로그인 후 복사

여기에서는 먼저 누락된 값을 그룹 평균으로 채운 다음 결과를 명시적으로 다시 "금액" 열에 할당합니다.

.ix 사용 (), .iloc() 및 .loc()

.ix(), .iloc() 및 .loc() 사용은 연결 할당에 직접적인 영향을 미치지 않습니다. 이러한 메서드는 DataFrame에서 데이터를 선택하는 데 사용되며 할당 동작 방식에 영향을 주지 않습니다.

경고 끄기

연결된 할당이 그렇지 않다고 확신하는 경우 코드에 문제가 발생하면 다음을 설정하여 SettingWithCopy 경고를 비활성화할 수 있습니다.

<code class="python">pd.set_option('chained_assignment', None)</code>
로그인 후 복사

거짓 긍정

연결된 할당 경고가 때때로 거짓일 수 있다는 점에 유의하는 것이 중요합니다. 긍정적인 점. 코드에 이런 경우가 있다고 생각되면 연결된 작업 중에 원치 않는 복사본이 생성될 위험이 있는지 신중하게 고려하세요.

예제 코드

문제를 설명하려면 연결된 할당의 경우 다음 코드를 고려하세요.

<code class="python">data['amount'].fillna(data.groupby("num")["amount"].transform("mean"), inplace=True)</code>
로그인 후 복사

여기서 inplace 작업은 "amount" 열을 직접 업데이트하는 데 사용됩니다. 그러나 그룹 평균이 원래 열과 다른 dtype인 경우 원치 않는 데이터 유형 변경이 발생할 수 있습니다.

결론

연결된 할당을 이해하면 이를 방지하는 데 도움이 됩니다. 잠재적인 위험을 방지하고 Pandas 코드가 예상대로 작동하는지 확인하세요. 실수로 데이터가 복사되는 것을 방지하려면 연결된 작업의 결과를 원래 열에 명시적으로 할당해야 합니다. 경고를 끌 수 있지만 일반적으로 예기치 않은 동작을 방지하기 위해 연결된 작업을 주의 깊게 검토하는 것이 좋습니다.

위 내용은 Pandas에서 연결된 할당의 결과를 언제 명시적으로 할당해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿