Pandas 튜토리얼: 이 라이브러리를 사용하여 Excel 파일을 읽는 방법에 대한 자세한 설명, 특정 코드 예제가 필요합니다.
Pandas는 특히 데이터 처리에서 많은 강력한 기능을 갖춘 일반적으로 사용되는 데이터 처리 라이브러리입니다. 실제 데이터 처리 과정에서 엑셀 파일을 읽어야 하는 경우가 종종 있습니다. 이 문서에서는 Pandas 라이브러리를 사용하여 Excel 파일을 읽는 방법과 특정 코드 예제를 제공하는 방법을 자세히 설명합니다.
Pandas 라이브러리를 사용하려면 먼저 라이브러리를 가져와야 합니다.
import pandas as pd
그 중 pd는 Pandas 라이브러리의 별칭으로 Pandas 관련 메서드를 더 쉽게 사용할 수 있도록 해줍니다.
Pandas를 사용하여 Excel 파일을 읽는 것은 매우 편리합니다. 코드 한 줄만 있으면 됩니다.
data = pd.read_excel('file_name.xlsx')
그 중 file_name.xlsx는 다음 위치에 있는 Excel 파일의 이름입니다. Python 스크립트와 동일한 디렉터리입니다.
Excel 파일이 동일한 디렉터리에 없으면 전체 경로를 지정해야 합니다. 예:
data = pd.read_excel('C:/Users/username/Desktop/file_name.xlsx')
Excel 파일을 읽은 후 다음 방법을 통해 파일의 데이터를 볼 수 있습니다.
print(data.head())
head () 메서드를 사용하면 Excel 파일을 볼 수 있습니다. 데이터의 처음 5행입니다. 더 많은 행을 보려면 괄호 안의 숫자를 보려는 행 수로 변경할 수 있습니다. 예:
print(data.head(10))
Excel 파일에 여러 개가 포함되어 있는 경우 테이블의 경우 필수 읽을 테이블을 지정해야 합니다. 예:
data = pd.read_excel('file_name.xlsx', sheet_name='Sheet1')
그중 sheet_name은 읽어야 할 테이블의 이름을 지정하는 데 사용됩니다. 여러 시트를 읽어야 하는 경우 sheet_name을 목록으로 변경할 수 있습니다. 예:
data = pd.read_excel('file_name.xlsx', sheet_name=['Sheet1', 'Sheet2'])
이렇게 하면 Sheet1과 Sheet2의 데이터를 한 번에 읽어 사전에 저장할 수 있습니다.
Excel 테이블에 많은 데이터가 있는 경우 때로는 일부 행이나 열만 읽어야 할 때도 있습니다. 이는 Pandas의 loc 및 iloc 메서드를 사용하여 수행할 수 있습니다.
loc 메소드는 지정된 행 또는 열 데이터를 읽을 수 있습니다. 예는 다음과 같습니다.
data = pd.read_excel('file_name.xlsx') # 读取第 3 行数据 print(data.loc[2]) # 读取名称为 'column_name' 的列数据 print(data.loc[:, 'column_name']) # 读取第 3 行、名称为 'column_name' 的数据 print(data.loc[2, 'column_name'])
iloc 메소드는 지정된 행 또는 열 데이터를 읽을 수 있지만 예는 다음과 같습니다.
data = pd.read_excel('file_name.xlsx') # 读取第 3 行数据 print(data.iloc[2]) # 读取第 3 行、第 4 列数据 print(data.iloc[2, 3]) # 读取第 2-4 行、第 1-3 列的数据 print(data.iloc[1:4, 0:3])
의 열 이름 Excel 파일을 읽는 과정에서 때로는 Excel 파일의 열 이름을 가져와야 하는 경우가 있습니다.
data = pd.read_excel('file_name.xlsx') # 读取所有列名 print(data.columns.values) # 读取第 3 列的列名 print(data.columns.values[2])
그 중에서. , columns.values는 열 이름 목록을 반환하는 데 사용됩니다. Python에서 목록 인덱스는 0부터 시작합니다.
Pandas는 Excel 파일을 읽는 것 외에도 Excel 파일에 데이터를 쓰는 방법도 제공합니다.
data = pd.DataFrame({'姓名': ['张三', '李四', '王五'], '年龄': [18, 22, 25]}) # 将数据写入名为 'MySheet' 的表格中 data.to_excel('file_name.xlsx', sheet_name='MySheet', index=False)
그 중 to_excel() 메소드는 엑셀 파일에 데이터를 쓰는 데 사용됩니다. 첫 번째 매개변수는 엑셀 파일 이름이고, 두 번째 매개변수는 작성할 테이블 이름입니다. index=False는 인덱스 열에 쓰기가 필요하지 않음을 의미합니다.
이 글에서는 주로 Pandas 라이브러리를 사용하여 Excel 파일을 읽는 방법을 소개하고 구체적인 코드 예제를 제공합니다. 물론 Pandas에는 일상적인 데이터 처리에서 더 잘 이해할 수 있는 다른 많은 기능이 있습니다.
위 내용은 팬더 튜토리얼: 이 라이브러리를 사용하여 Excel 파일을 읽는 방법에 대한 자세한 설명의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!