Pandas DataFrame을 열 값으로 분할
'Sales'라는 열이 있는 DataFrame이 있는 시나리오를 생각해 보세요. 첫 번째 DataFrame에는 'Sales'가 지정된 임계값보다 작은 데이터가 포함되고 두 번째 DataFrame에는 'Sales'가 지정된 임계값보다 큰 데이터가 포함되도록 'Sales' 열의 값을 기준으로 이 DataFrame을 두 개로 분리하려고 합니다. 또는 임계값과 같습니다.
이를 달성하려면 Pandas에서 부울 인덱싱을 활용할 수 있습니다. 예는 다음과 같습니다.
<code class="python">import pandas as pd # Create a sample DataFrame df = pd.DataFrame({'Sales': [10, 20, 30, 40, 50], 'A': [3, 4, 7, 6, 1]}) print(df) # Set the threshold (s) s = 30 # Split the DataFrame based on the 'Sales' column df1 = df[df['Sales'] >= s] print(df1) df2 = df[df['Sales'] < s] print(df2)
출력:
A Sales 0 3 10 1 4 20 2 7 30 3 6 40 4 1 50 A Sales 2 7 30 3 6 40 4 1 50 A Sales 0 3 10 1 4 20
또는 역마스크 연산자(~)를 사용하여 동일한 결과를 얻을 수 있습니다.
<code class="python">mask = df['Sales'] >= s df1 = df[mask] df2 = df[~mask] print(df1) print(df2)</code>
이전 예와 동일한 효과가 나타납니다.
위 내용은 열 값 임계값을 기준으로 Pandas DataFrame을 분할하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!