데이터 분석 도구: Pandas에서 열 이름 수정 기술 습득
소개:
데이터 분석 프로세스 중에 데이터 세트의 열 이름을 수정해야 하는 상황에 자주 직면합니다. Pandas는 Python에서 일반적으로 사용되는 데이터 처리 라이브러리로, 데이터를 처리하고 분석하는 유연하고 강력한 기능을 제공합니다. 오늘은 Pandas에서 열 이름을 수정하는 기술에 중점을 두고 구체적인 코드 예제를 통해 시연해 보겠습니다.
1. 기존 열 이름 보기
먼저 현재 데이터 세트의 열 이름을 이해해야 합니다. Pandas에서 df.columns
를 사용하여 DataFrame의 열 이름을 확인하세요. 예를 들어 다음과 같은 데이터 프레임 df가 있습니다. df.columns
可以查看数据框(DataFrame)的列名。例如,我们有如下数据框df:
import pandas as pd
data = {'A': [1, 2, 3],
'B': [4, 5, 6],
'C': [7, 8, 9]}
df = pd.DataFrame(data)
로그인 후 복사
我们可以使用df.columns
print(df.columns)
로그인 후 복사
로그인 후 복사
로그인 후 복사
로그인 후 복사
df.columns
를 사용하여 df의 열 이름을 볼 수 있습니다.
Index(['A', 'B', 'C'], dtype='object')
로그인 후 복사
실행 결과는 다음과 같습니다.
df.columns = ['New_A', 'B', 'C']
로그인 후 복사
2. 열 이름 수정
열 이름 직접 수정
Pandas에서는 값을 할당하여 열 이름을 직접 수정할 수 있습니다. 예를 들어 컬럼 이름 'A'를 'New_A'로 수정하려고 합니다.
print(df.columns)
로그인 후 복사
로그인 후 복사
로그인 후 복사
로그인 후 복사
실행 후 df의 컬럼 이름을 다시 확인합니다.
Index(['New_A', 'B', 'C'], dtype='object')
로그인 후 복사
실행 결과는 다음과 같습니다.
df = df.rename(columns={'B': 'New_B'})
로그인 후 복사
이렇게 하면 필요한 모든 항목을 수정할 수 있습니다. 열 이름은 한 번에 모두 수정됩니다.
rename() 함수를 사용하여 열 이름 수정
열 이름을 수정하기 위해 값을 직접 할당하는 것 외에도 Pandas는 열 이름을 수정하기 위한 rename() 함수도 제공합니다. 이 방법은 더 유연하며 일부 열 이름을 선택적으로 수정할 수 있습니다. 예를 들어 컬럼 이름 'B'를 'New_B'로 변경하면 다음 코드를 사용할 수 있습니다.
print(df.columns)
로그인 후 복사
로그인 후 복사
로그인 후 복사
로그인 후 복사
실행 후 df의 컬럼 이름을 다시 확인합니다.
Index(['New_A', 'New_B', 'C'], dtype='object')
로그인 후 복사
실행 결과는 다음과 같습니다.
df.columns = df.columns.map(lambda x: 'New_' + x)
로그인 후 복사
이렇게 하면 다른 열 이름의 이름에는 영향을 주지 않고 지정된 열 이름만 수정됩니다.
map() 함수를 사용하여 열 이름의 일부를 수정하세요
때로는 열 이름 앞에 접두사를 추가하는 등 열 이름을 부분적으로 수정해야 할 수도 있습니다. 부분적인 열 이름에 대해 작업하려면 map() 함수를 사용하십시오. 예를 들어 컬럼명 앞에 'New_' 접두사를 붙이면 다음과 같은 코드를 사용할 수 있다.
print(df.columns)
로그인 후 복사
로그인 후 복사
로그인 후 복사
로그인 후 복사
실행 후 다시 df의 컬럼명을 확인한다.
Index(['New_New_A', 'New_New_B', 'New_C'], dtype='object')
로그인 후 복사
실행 결과는 다음과 같다.
rrreee
이런 방법으로 열을 비교할 수 있습니다. 이름을 부분적으로 유연하게 수정할 수 있습니다.
3. 응용 시나리오
Pandas에서 열 이름을 수정하는 기술을 익히는 것은 데이터 분석 작업에 매우 중요합니다. 다음은 여러 적용 시나리오의 예입니다.
- 데이터 정리: 데이터 정리 과정에서 열 이름을 표준화하고 비표준 열 이름을 통합 명명 표준으로 수정해야 하는 경우가 많습니다.
- 데이터 병합: merge() 또는 Join() 함수를 사용하여 데이터를 병합할 때 열을 다른 데이터 소스와 구별하기 위해 병합된 열 이름을 수정해야 하는 경우가 많습니다.
- 데이터 내보내기: 데이터를 Excel 또는 CSV 파일로 내보낼 때 열 이름을 수정하여 더 설명적이고 파일의 가독성을 높일 수 있습니다.
요약:
이 글의 소개를 통해 Pandas에서 열 이름을 수정하는 기술에 대해 알아보고 구체적인 코드 예제를 통해 시연했습니다. 이러한 기술을 익히면 데이터 분석 프로세스 중에 열 이름을 보다 유연하게 수정하고 데이터 처리 및 분석의 효율성을 향상시키는 데 도움이 될 수 있습니다. 동시에 합리적인 컬럼 이름 지정은 데이터의 가독성과 이해도를 높이는 데에도 도움이 되며, 데이터 분석 결과의 해석과 시각적 표시에도 큰 도움이 됩니다. 이 글이 여러분의 데이터 분석 작업에 도움이 되기를 바랍니다. 읽어주셔서 감사합니다! 🎜
위 내용은 데이터 분석을 위한 필수 도구인 Pandas에서 열 이름을 수정하는 방법을 익히세요.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!