기존 열을 기반으로 한 값으로 새 열 생성
특정 데이터 분석 시나리오에서는 다음과 같은 새 열을 생성해야 할 수도 있습니다. 값은 기존 열의 특정 조건에 따라 선택됩니다. 이는 확인할 조건 수에 따라 Python의 다양한 방법을 사용하여 달성할 수 있습니다.
np.where를 사용한 두 가지 선택 시나리오
두 개만 있는 경우 선택할 수 있는 항목이 있으면 numpy 함수 np.where를 효율적으로 사용할 수 있습니다. 형식은 다음과 같습니다.
df['new_column'] = np.where(condition, value_if_true, value_if_false)
여기서 'df'는 데이터 프레임이고 'condition'은 조건을 정의하는 부울 표현식이며 'value_if_true'는 조건이 True인 경우 할당되는 값입니다. 'value_if_false'는 조건이 False인 경우 할당되는 값입니다.
예를 들어 제공된 데이터 프레임에 'color' 열을 생성하려면 'Set'이 'Z'이면 'color'는 'green'이고 그렇지 않으면 다음을 사용할 수 있습니다.
df['color'] = np.where(df['Set']=='Z', 'green', 'red')
np.select를 사용한 여러 조건
확인할 조건이 2개 이상인 경우 numpy 함수 np.select를 활용할 수 있습니다. 이는 보다 복잡한 조건부 논리를 허용합니다. 형식은 다음과 같습니다.
df['new_column'] = np.select(conditions, choices, default=None)
여기서 'conditions'는 부울 표현식의 목록이고 'choices'는 각 조건에 해당하는 값의 목록이며 'default'는 다음과 같은 경우에 할당되는 값입니다. 어느 조건도 만족하지 않습니다.
예를 들어 ('Set' == 'Z') & ('Type'일 때 'color'를 'yellow'로 지정하려는 경우 == 'A'), ('Set' == 'Z') & ('Type' == 'B')인 경우 '파란색', ('Type' == 'B')인 경우 '보라색', 그렇지 않으면 '검은색'을 사용할 수 있습니다:
conditions = [ (df['Set'] == 'Z') & (df['Type'] == 'A'), (df['Set'] == 'Z') & (df['Type'] == 'B'), (df['Type'] == 'B')] choices = ['yellow', 'blue', 'purple'] df['color'] = np.select(conditions, choices, default='black')
위 내용은 Python을 사용하여 기존 열의 조건을 기반으로 새 열을 만드는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!