Pandas df['column'] = expression
구문 세부 설명: Pandas DataFrame(df)에서 열을 생성, 수정 또는 할당하는 데 사용됩니다. 기본부터 고급까지 단계별로 분석해 보겠습니다.
DataFrame에 열이 없는 경우 df['column']
에 값을 할당하면 새 열이 생성됩니다.
예:
<code class="language-python"> import pandas as pd df = pd.DataFrame({'A': [1, 2, 3]}) print(df) # 输出: # A # 0 1 # 1 2 # 2 3 # 创建一个新列 'B',所有值都设置为 0 df['B'] = 0 print(df) # 输出: # A B # 0 1 0 # 1 2 0 # 2 3 0</code>
열이 이미 존재하는 경우 할당으로 해당 내용이 대체됩니다.
예:
<code class="language-python"> df['B'] = [4, 5, 6] # 替换列 'B' 中的值 print(df) # 输出: # A B # 0 1 4 # 1 2 5 # 2 3 6</code>
계산 또는 변환을 기반으로 열에 값을 할당할 수 있습니다.
예:
<code class="language-python"> df['C'] = df['A'] + df['B'] # 创建列 'C' 为 'A' 和 'B' 的和 print(df) # 输出: # A B C # 0 1 4 5 # 1 2 5 7 # 2 3 6 9</code>
조건부 할당에 Pandas의 부울 인덱싱을 사용할 수 있습니다.
예:
<code class="language-python"> df['D'] = df['A'].apply(lambda x: 'Even' if x % 2 == 0 else 'Odd') print(df) # 输出: # A B C D # 0 1 4 5 Odd # 1 2 5 7 Even # 2 3 6 9 Odd</code>
더 복잡한 계산을 위해 하나의 표현식에 여러 열을 사용할 수 있습니다.
예:
<code class="language-python"> df['E'] = (df['A'] + df['B']) * df['C'] print(df) # 输出: # A B C D E # 0 1 4 5 Odd 25 # 1 2 5 7 Even 49 # 2 3 6 9 Odd 81</code>
숫자 할당에서는 벡터화 연산을 사용하여 성능을 향상할 수 있습니다.
예:
<code class="language-python"> df['F'] = df['A'] ** 2 + df['B'] ** 2 # 快速向量化计算 print(df) # 输出: # A B C D E F # 0 1 4 5 Odd 25 17 # 1 2 5 7 Even 49 29 # 2 3 6 9 Odd 81 45</code>
np.where
을 사용하세요조건부 할당에 NumPy를 사용할 수 있습니다.
예:
<code class="language-python"> import numpy as np df['G'] = np.where(df['A'] > 2, 'High', 'Low') print(df) # 输出: # A B C D E F G # 0 1 4 5 Odd 25 17 Low # 1 2 5 7 Even 49 29 Low # 2 3 6 9 Odd 81 45 High</code>
행이나 열에 적용된 사용자 정의 함수를 기반으로 열에 값을 할당합니다.
예:
<code class="language-python"> def custom_function(row): return row['A'] * row['B'] df['H'] = df.apply(custom_function, axis=1) print(df) # 输出: # A B C D E F G H # 0 1 4 5 Odd 25 17 Low 4 # 1 2 5 7 Even 49 29 Low 10 # 2 3 6 9 Odd 81 45 High 18</code>
여러 작업을 함께 연결하여 코드를 더욱 간결하게 만들 수 있습니다.
예:
<code class="language-python"> df['I'] = df['A'].add(df['B']).mul(df['C']) print(df) # 输出: # A B C D E F G H I # 0 1 4 5 Odd 25 17 Low 4 25 # 1 2 5 7 Even 49 29 Low 10 49 # 2 3 6 9 Odd 81 45 High 18 81</code>
한 번의 호출로 여러 열을 생성하거나 수정하려면 assign()
을 사용하세요.
예:
<code class="language-python"> df = df.assign( J=df['A'] + df['B'], K=lambda x: x['J'] * 2 ) print(df) # 输出: # A B C D E F G H I J K # 0 1 4 5 Odd 25 17 Low 4 25 5 10 # 1 2 5 7 Even 49 29 Low 10 49 7 14 # 2 3 6 9 Odd 81 45 High 18 81 9 18</code>
외부 입력을 기반으로 열 이름을 동적으로 생성합니다.
예:
<code class="language-python"> columns_to_add = ['L', 'M'] for col in columns_to_add: df[col] = df['A'] + df['B'] print(df)</code>
외부 DataFrame 또는 사전을 기반으로 열에 값을 할당합니다.
예:
<code class="language-python"> mapping = {1: 'Low', 2: 'Medium', 3: 'High'} df['N'] = df['A'].map(mapping) print(df) # 输出: # A B C D E F G H I J K N # 0 1 4 5 Odd 25 17 Low 4 25 5 10 Low # 1 2 5 7 Even 49 29 Low 10 49 7 14 Medium # 2 3 6 9 Odd 81 45 High 18 81 9 18 High</code>
apply
, 벡터화된 작업)를 사용하면 Python 루프보다 성능이 더 좋습니다. df['column'] = expression
구문은 Pandas의 핵심 기능이며 다양한 용도로 사용됩니다. 다음이 허용됩니다:
이로 인해 Pandas는 강력한 데이터 조작 및 분석 라이브러리가 됩니다.
위 내용은 팬더의 `df[column] = 표현식` 구문에 대한 설명의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!