Pandas를 사용하여 Excel 파일을 읽는 쉬운 방법
데이터 분석 및 처리에서는 Excel 파일에서 데이터를 읽고 다양한 작업을 수행해야 하는 경우가 많습니다. Pandas는 Excel 파일을 읽는 간단하고 편리한 방법을 제공하는 강력한 Python 데이터 분석 라이브러리입니다. 이 기사에서는 Pandas를 사용하여 Excel 파일을 읽는 방법을 소개하고 특정 코드 예제를 제공합니다.
시작하기 전에 Pandas 라이브러리가 설치되어 있는지 확인하세요. Pandas는 다음 코드를 사용하여 설치할 수 있습니다.
pip install pandas
다음으로 "Sheet1"이라는 워크시트가 포함된 "example.xlsx"라는 Excel 파일이 있다고 가정합니다. 이 워크시트에는 이름, 나이, 성별을 포함한 일부 데이터가 있습니다. 이 Excel 파일에서 데이터를 읽어보겠습니다.
먼저 Pandas 라이브러리를 가져와서 Excel 파일을 읽어보겠습니다.
import pandas as pd df = pd.read_excel('example.xlsx', sheet_name='Sheet1')
위 코드에서는 read_excel
함수를 사용하여 Excel 파일을 읽습니다. 그 중 example.xlsx
는 읽어올 엑셀 파일의 파일명이고, sheet_name='Sheet1'
은 읽어올 워크시트의 이름이다. sheet_name
매개변수를 지정하지 않으면 기본적으로 첫 번째 워크시트를 읽습니다. read_excel
函数来读取Excel文件。其中,example.xlsx
是要读取的Excel文件的文件名,sheet_name='Sheet1'
是要读取的工作表的名称。如果不指定sheet_name
参数,则默认读取第一个工作表。
读取Excel文件后,Pandas将数据以DataFrame的形式存储在变量df
中。DataFrame是一种二维标签数组,类似于Excel中的表格。每列的名称称为列标签,而每行的索引称为行标签。
现在,我们可以对读取到的数据进行各种操作,比如查看前几行的数据、获取某列的数据、筛选数据等。
查看前几行的数据:
print(df.head())
获取某列的数据:
name_column = df['姓名'] print(name_column)
筛选数据:
filtered_data = df[df['年龄'] > 30] print(filtered_data)
上面的代码中,df.head()
将显示DataFrame的前几行数据,默认显示前5行。df['姓名']
将获取名为"姓名"的列的数据,而df[df['年龄'] > 30]
将根据"年龄"列的条件筛选出符合条件的数据。
除了读取Excel文件,Pandas还提供了其他一些方法来处理Excel文件,例如写入数据到Excel文件、添加新的工作表等。下面是一些常用的方法:
将DataFrame写入Excel文件:
df.to_excel('output.xlsx', sheet_name='Sheet2', index=False)
上面的代码将DataFrame写入到"output.xlsx"文件的名为"Sheet2"的工作表中,并设置index=False
以不包含行索引。
添加新的工作表到现有的Excel文件:
with pd.ExcelWriter('example.xlsx', mode='a') as writer: df.to_excel(writer, sheet_name='Sheet2', index=False)
上面的代码使用pd.ExcelWriter
将DataFrame写入到现有的Excel文件中,并设置mode='a'
以追加写入。df.to_excel()
df
변수에 저장합니다. DataFrame은 Excel의 테이블과 유사한 2차원 레이블 배열입니다. 각 열의 이름을 열 레이블이라고 하고, 각 행의 인덱스를 행 레이블이라고 합니다. 이제 읽기 데이터에 대해 처음 몇 행의 데이터 보기, 특정 열의 데이터 가져오기, 데이터 필터링 등 다양한 작업을 수행할 수 있습니다.
df.head()
는 DataFrame 데이터의 처음 몇 행을 표시하며, 처음 5개 행은 기본적으로 표시됩니다. df['Name']
는 "Name"이라는 열에 대한 데이터를 가져오고, df[df['Age'] > 30]
은 다음을 기반으로 데이터를 가져옵니다. "연령" 열 조건에서 조건을 충족하는 데이터를 필터링합니다. 🎜🎜Pandas는 Excel 파일을 읽는 것 외에도 Excel 파일에 데이터 쓰기, 새 워크시트 추가 등 Excel 파일을 처리하는 몇 가지 다른 방법도 제공합니다. 다음은 일반적으로 사용되는 몇 가지 방법입니다. 🎜index=False
는 행 인덱스를 포함하지 않습니다. 🎜🎜pd.ExcelWriter
를 사용하여 기존 Excel 파일에 DataFrame을 쓰고 mode='를 설정합니다. a'
추가 쓰기용입니다. df.to_excel()
메서드는 DataFrame을 "Sheet2" 워크시트에 씁니다. 🎜🎜🎜🎜Pandas를 사용하면 Excel 파일을 쉽게 읽고 처리할 수 있으며, 다양한 작업을 수행하여 데이터 분석 및 처리를 보다 효율적이고 편리하게 할 수 있습니다. 위는 Pandas를 사용하여 Excel 파일을 읽는 간단한 방법의 소개 및 샘플 코드입니다. 도움이 되었기를 바랍니다! 🎜위 내용은 Excel 파일을 빠르게 읽는 Pandas 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!