Pandas가 Excel 파일을 읽는 단계: 1. Pandas 라이브러리가 설치되었는지 확인합니다. 2. Pandas 라이브러리와 필요할 수 있는 기타 라이브러리를 가져옵니다. 3. Pandas의 "read_excel()" 함수를 사용하여 Excel 파일을 읽습니다. 4. 데이터의 처음 몇 행 보기, 데이터의 기본 통계 보기, 특정 열 선택, 데이터 필터링, 정렬, 데이터 그룹화 및 집계, 데이터 시각화 등과 같은 데이터 조작 및 분석.
이 튜토리얼의 운영 체제: Windows 10 시스템, Python 버전 3.11.4, Dell G3 컴퓨터.
Pandas는 Excel 파일을 포함한 다양한 유형의 데이터를 읽고 분석하고 처리하는 데 사용할 수 있는 강력한 데이터 처리 라이브러리입니다. 이번 글에서는 Pandas를 이용하여 Excel 파일을 읽는 방법과 관련 코드에 대해 설명하겠습니다.
먼저 Pandas 라이브러리가 설치되어 있는지 확인해야 합니다. Pandas는 다음 명령을 사용하여 Python 환경에 설치할 수 있습니다.
pip install pandas
다음으로 Pandas 라이브러리와 필요할 수 있는 기타 라이브러리를 가져와야 합니다.
import pandas as pd
이제 Pandas의 read_excel() 함수를 사용하여 엑셀 파일. 다음은 샘플 코드입니다.
df = pd.read_excel('example.xlsx')
위 코드에서 read_excel() 함수는 Excel 파일의 경로인 하나의 매개 변수를 허용합니다. 그러면 Excel 파일의 데이터가 포함된 df라는 Pandas DataFrame 개체가 반환됩니다.
파일 경로 외에도 read_excel() 함수에는 읽을 특정 워크시트, 건너뛸 행 수, 구문 분석할 열 등을 지정하는 데 사용할 수 있는 다른 선택적 매개 변수가 있습니다. 예:
df = pd.read_excel('example.xlsx', sheet_name='Sheet1', skiprows=2, usecols='A:C')
위 코드에서 sheet_name 매개변수는 읽을 워크시트의 이름을 지정하고, Skiprows 매개변수는 건너뛸 행 수를 지정하고, usecols 매개변수는 구문 분석할 열 범위를 지정합니다.
Excel 파일을 읽은 후 Pandas에서 제공하는 다양한 기능과 방법을 사용하여 데이터를 조작하고 분석할 수 있습니다. 다음은 몇 가지 일반적인 작업 예입니다.
데이터의 처음 몇 행 보기:
df.head()
데이터의 기본 통계 보기:
df.describe()
특정 열 선택:
df['Column1']
필터:
df[df['Column1'] > 10]
데이터 정렬:
df.sort_values('Column1', ascending=False)
데이터 그룹화 및 집계:
df.groupby('Column1').mean()
데이터 시각화:
df.plot(x='Column1', y='Column2', kind='scatter')
위 코드의 Column1과 Column2는 Excel 파일의 열 이름이므로 바꿀 수 있습니다. 실제 상황에 따라.
요약하자면 Pandas를 사용하여 Excel 파일을 읽는 기본 단계에는 라이브러리 가져오기, read_excel() 함수를 사용하여 파일 읽기, 데이터 조작 및 분석이 포함됩니다. 이러한 작업을 통해 Excel 파일의 데이터를 쉽게 읽고 처리할 수 있으며 추가 분석 및 시각화를 수행할 수 있습니다.
위 내용은 Pandas로 Excel 파일을 읽는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!