열 값 임계값을 기준으로 Pandas DataFrame을 분할하는 방법은 무엇입니까?

DDD
풀어 주다: 2024-10-19 22:30:29
원래의
762명이 탐색했습니다.

How to Split a Pandas DataFrame Based on a Column Value Threshold?

Pandas DataFrame을 열 값으로 분할

'Sales'라는 열이 있는 DataFrame이 있는 시나리오를 생각해 보세요. 첫 번째 DataFrame에는 'Sales'가 지정된 임계값보다 작은 데이터가 포함되고 두 번째 DataFrame에는 'Sales'가 지정된 임계값보다 큰 데이터가 포함되도록 'Sales' 열의 값을 기준으로 이 DataFrame을 두 개로 분리하려고 합니다. 또는 임계값과 같습니다.

이를 달성하려면 Pandas에서 부울 인덱싱을 활용할 수 있습니다. 예는 다음과 같습니다.

<code class="python">import pandas as pd

# Create a sample DataFrame
df = pd.DataFrame({'Sales': [10, 20, 30, 40, 50], 'A': [3, 4, 7, 6, 1]})
print(df)

# Set the threshold (s)
s = 30

# Split the DataFrame based on the 'Sales' column
df1 = df[df['Sales'] >= s]
print(df1)

df2 = df[df['Sales'] < s]
print(df2)
로그인 후 복사

출력:

   A  Sales
0  3     10
1  4     20
2  7     30
3  6     40
4  1     50

   A  Sales
2  7     30
3  6     40
4  1     50

   A  Sales
0  3     10
1  4     20
로그인 후 복사

또는 역마스크 연산자(~)를 사용하여 동일한 결과를 얻을 수 있습니다.

<code class="python">mask = df['Sales'] >= s
df1 = df[mask]
df2 = df[~mask]
print(df1)
print(df2)</code>
로그인 후 복사

이전 예와 동일한 효과가 나타납니다.

위 내용은 열 값 임계값을 기준으로 Pandas DataFrame을 분할하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿
회사 소개 부인 성명 Sitemap
PHP 중국어 웹사이트:공공복지 온라인 PHP 교육,PHP 학습자의 빠른 성장을 도와주세요!