Pandas를 사용하여 Excel 파일을 읽고 데이터 가져오기 및 분석을 쉽게 구현-파이썬 튜토리얼-php.cn

집

백엔드 개발

파이썬 튜토리얼

Pandas를 사용하여 Excel 파일을 읽고 데이터 가져오기 및 분석을 쉽게 구현

PHPz

Jan 19, 2024 am 10:02 AM

excel 데이터 분석 pandas

Pandas를 사용하여 Excel 파일을 읽고 데이터 가져오기 및 분석을 쉽게 구현

pandas를 사용하여 Excel 파일을 읽고 데이터 가져오기 및 분석을 쉽게 구현하세요.

pandas는 Python의 데이터 분석을 위한 강력한 도구로 다양한 형식의 데이터를 유연하고 효율적으로 처리할 수 있습니다. 데이터 분석에 있어서 흔히 사용되는 데이터 형식은 엑셀인데, 팬더스는 엑셀 파일을 데이터로 빠르게 가져와서 분석, 처리할 수 있는 편리한 인터페이스를 제공합니다.

이 글에서는 pandas 라이브러리를 사용하여 Excel 파일을 읽는 방법과 pandas를 사용하여 데이터 분석하는 방법을 소개하고 코드 예제를 제공합니다.

1. Excel 파일 읽기
Excel 파일을 읽으려면 Pandas에서 제공하는 read_excel 함수를 사용하면 Excel 파일을 직접 읽고 DataFrame 데이터 형식으로 변환할 수 있습니다. 다음은 Excel 파일을 읽는 코드 예제입니다.

import pandas as pd

# 读取Excel文件
filename = 'data.xlsx'
df = pd.read_excel(filename)

# 查看数据前5行
print(df.head())

로그인 후 복사

위 코드에서는 먼저 pandas 라이브러리를 가져오고 별칭을 pd로 지정했습니다. 그런 다음 pd.read_excel 함수를 사용하여 data.xlsx 파일을 읽고 읽은 데이터를 df라는 DataFrame에 저장합니다. 마지막으로 head 메소드를 사용하여 데이터의 처음 5개 행을 확인합니다.

2. 데이터 분석

데이터 전처리
데이터를 가져온 후에는 데이터 전처리를 수행해야 합니다. 데이터 전처리에는 데이터 정리, 누락된 값 채우기, 중복 제거, 데이터 유형 변환과 같은 작업이 포함됩니다. 다음은 데이터 전처리를 위한 샘플 코드입니다.

# 删除含有缺失值的行
df = df.dropna()

# 删除重复行
df = df.drop_duplicates()

# 转换数据类型为float
df['column1'] = df['column1'].astype(float)

# 查看数据信息
print(df.info())

로그인 후 복사

위 코드에서는 먼저 dropna 메소드를 사용하여 누락된 값이 포함된 모든 행을 삭제한 다음 drop_duplicates 메소드를 사용하여 중복 행을 삭제했습니다. 다음으로 astype 메소드를 사용하여 column1의 데이터 유형을 float 유형으로 변환합니다. 마지막으로 info 메소드를 사용하여 데이터 정보를 확인합니다.

통계 분석

통계 분석은 데이터 분석의 핵심 단계 중 하나입니다. Pandas는 데이터의 통계 분석을 달성하기 위한 다양한 방법을 제공합니다.

다음은 데이터 분석 샘플 코드입니다.

# 计算各列的平均值、标准差、最大/最小值
print(df.mean())
print(df.std())
print(df.max())
print(df.min())

# 按照一列的值进行分组，并计算每组中数据的平均值
print(df.groupby('column1').mean())

# 绘制柱状图
df['column1'].plot(kind='bar')

로그인 후 복사

위 코드에서는 평균, 표준편차, 최대값, 최소값을 사용하여 각 열의 평균, 표준편차, 최대값/최소값을 각각 계산합니다. 그런 다음 groupby 메서드를 사용하여 column1의 값을 그룹화하고 각 그룹의 데이터 평균을 계산합니다. 마지막으로, 플롯 방법을 사용하여 히스토그램을 그립니다.

3. 요약
이 기사에서는 팬더를 사용하여 Excel 파일을 읽고 데이터를 처리하고 분석하는 방법을 소개합니다. Pandas는 데이터 분석을 더 쉽고 효율적으로 만들기 위해 다양한 편리한 작업을 제공합니다. 데이터 분석 및 마이닝 작업에 팬더를 학습하는 것은 매우 유용할 것입니다.

위 내용은 Pandas를 사용하여 Excel 파일을 읽고 데이터 가져오기 및 분석을 쉽게 구현의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

뜨거운 주제

자바 튜토리얼

1672

Cakephp 튜토리얼

1428

라라벨 튜토리얼

1332

PHP 튜토리얼

1276

C# 튜토리얼

1256

Related knowledge

엑셀 인쇄 시 테두리 선이 사라지면 어떻게 해야 하나요? Mar 21, 2024 am 09:50 AM

인쇄해야 하는 파일을 열 때 인쇄 미리보기에서 어떤 이유로 인해 테이블 프레임 선이 사라진 것을 발견할 수 있습니다. 이러한 상황이 발생하면 인쇄에도 나타나는 경우 제때에 처리해야 합니다. file 이런 질문이 있으시면 에디터에 가입하여 다음 강좌를 배워보세요. Excel에서 표를 인쇄할 때 테두리 선이 사라지면 어떻게 해야 하나요? 1. 아래 그림과 같이 인쇄할 파일을 엽니다. 2. 아래 그림과 같이 필요한 콘텐츠 영역을 모두 선택합니다. 3. 아래 그림과 같이 마우스 오른쪽 버튼을 클릭하고 "셀 서식" 옵션을 선택합니다. 4. 아래 그림과 같이 창 상단의 "테두리" 옵션을 클릭하세요. 5. 아래 그림과 같이 왼쪽 선 스타일에서 가는 실선 패턴을 선택합니다. 6. '외부 테두리'를 선택하세요.

Excel에서 동시에 3개 이상의 키워드를 필터링하는 방법 Mar 21, 2024 pm 03:16 PM

엑셀은 일상적인 사무에서 데이터를 처리하는 데 자주 사용되며, "필터" 기능을 사용해야 하는 경우가 많습니다. Excel에서 "필터링"을 수행하도록 선택하면 동일한 열에 대해 최대 2개의 조건만 필터링할 수 있습니다. 그러면 Excel에서 동시에 3개 이상의 키워드를 필터링하는 방법을 알고 계십니까? 다음으로 여러분에게 보여드리겠습니다. 첫 번째 방법은 필터에 조건을 점진적으로 추가하는 것입니다. 세 가지 적격 세부정보를 동시에 필터링하려면 먼저 그 중 하나를 단계별로 필터링해야 합니다. 처음에는 조건에 따라 "Wang"이라는 직원을 먼저 필터링할 수 있습니다. 그런 다음 [확인]을 클릭한 후 필터 결과에서 [현재 선택 항목을 필터에 추가]를 선택하세요. 단계는 다음과 같습니다. 마찬가지로 다시 별도로 필터링을 수행합니다.

Excel 테이블 호환 모드를 일반 모드로 변경하는 방법 Mar 20, 2024 pm 08:01 PM

일상 업무나 공부를 하다 보면 다른 사람의 엑셀 파일을 복사해서 열어서 내용을 추가하거나 다시 편집하고 저장하는 경우가 가끔 있는데, 엑셀을 잘 몰라서 가끔 호환성 확인 대화 상자가 뜨는 경우가 있습니다. 소프트웨어, 일반 모드로 변경할 수 있나요? 따라서 아래에서 편집자가 이 문제를 해결하기 위한 자세한 단계를 알려드릴 것입니다. 함께 배워보겠습니다. 마지막으로 저장하는 것을 잊지 마세요. 1. 워크시트를 열고 그림과 같이 워크시트 이름에 추가 호환성 모드를 표시합니다. 2. 이 워크시트에서는 내용을 수정하고 저장하면 항상 호환성 검사 대화상자가 팝업되는데, 그림과 같이 이 페이지를 보는 것이 매우 번거롭습니다. 3. Office 버튼을 클릭하고 다른 이름으로 저장을 클릭한 다음

Excel에서 위 첨자를 설정하는 방법 Mar 20, 2024 pm 04:30 PM

데이터를 처리하다 보면 배수, 온도 등 다양한 기호가 포함된 데이터를 접하게 되는 경우가 있습니다. Excel에서 위 첨자를 설정하는 방법을 알고 계시나요? Excel을 사용하여 데이터를 처리할 때 위 첨자를 설정하지 않으면 많은 양의 데이터를 입력하는 것이 더 번거로워집니다. 오늘은 에디터가 엑셀 위 첨자의 구체적인 설정 방법을 알려드리겠습니다. 1. 먼저, 그림과 같이 바탕 화면에서 Microsoft Office Excel 문서를 열고 위 첨자로 수정해야 할 텍스트를 선택하겠습니다. 2. 그런 다음 그림과 같이 마우스 오른쪽 버튼을 클릭하고 클릭 후 나타나는 메뉴에서 "셀 서식"옵션을 선택하십시오. 3. 다음으로 자동으로 나타나는 “셀 서식” 대화 상자에서

Excel에서 iif 함수를 사용하는 방법 Mar 20, 2024 pm 06:10 PM

대부분의 사용자는 테이블 데이터를 처리하기 위해 Excel을 사용합니다. 실제로 Excel에도 VBA 프로그램이 있습니다. 전문가를 제외하고는 이 기능을 사용하는 사용자가 많지 않습니다. iif 함수는 실제로 VBA와 유사합니다. iif 함수의 사용법을 소개하겠습니다. SQL 문에는 iif 함수가 있고 Excel에는 VBA 코드가 있습니다. iif 함수는 Excel 워크시트의 IF 함수와 유사하며 참과 거짓 값을 판단하고 논리적으로 계산된 참과 거짓 값을 기반으로 서로 다른 결과를 반환합니다. IF 함수 사용법은 (조건, 예, 아니오)입니다. VBA의 IF문과 IIF 함수 전자의 IF문은 조건에 따라 다른 명령문을 실행할 수 있는 제어문인 반면 후자는

Excel 읽기 모드를 설정하는 위치 Mar 21, 2024 am 08:40 AM

소프트웨어 공부에 있어서 우리는 엑셀을 사용하는데 익숙해져 있는데, 편리할 뿐만 아니라 실제 업무에 필요한 다양한 형식을 충족할 수 있고, 엑셀은 사용하기에 매우 유연하며, 읽기에 편리합니다. 오늘은 모두를 위한 엑셀 읽기 모드 설정 위치를 가져왔습니다. 1. 컴퓨터를 켠 다음 Excel 응용 프로그램을 열고 대상 데이터를 찾습니다. 2. Excel에서 읽기 모드를 설정하는 방법에는 두 가지가 있습니다. 첫 번째: Excel에는 Excel 레이아웃에 배포된 편리한 처리 방법이 많이 있습니다. 엑셀 오른쪽 하단에 읽기 모드 설정 바로가기가 있습니다. 십자 표시 패턴을 찾아 클릭하면 십자 표시 오른쪽에 작은 입체 표시가 있습니다. .

PPT 슬라이드에 엑셀 아이콘을 삽입하는 방법 Mar 26, 2024 pm 05:40 PM

1. PPT를 열고 엑셀 아이콘을 삽입해야 하는 페이지로 페이지를 넘깁니다. 삽입 탭을 클릭합니다. 2. [개체]를 클릭하세요. 3. 다음과 같은 대화상자가 나타납니다. 4. [파일에서 생성]을 클릭한 후 [찾아보기]를 클릭하세요. 5. 삽입할 엑셀 표를 선택하세요. 6. 확인을 클릭하면 다음 페이지가 나타납니다. 7. [아이콘으로 표시]를 체크하세요. 8. 확인을 클릭합니다.

Excel에서 루트 번호를 여는 방법을 알고 있습니까? Mar 20, 2024 pm 07:11 PM

안녕하세요 여러분, 오늘 저는 여러분과 다시 튜토리얼을 공유하기 위해 왔습니다. Excel 스프레드시트에서 루트 번호를 여는 방법을 알고 있나요? 가끔 엑셀 표를 사용할 때 루트 기호를 사용하는 경우가 많습니다. 베테랑에게는 루트 계정을 개설하는 것이 쉬운 일이지만 초보 학생에게는 Excel에서 루트 계정을 개설하는 것이 어렵습니다. 오늘은 엑셀에서 루트번호를 여는 방법에 대해 자세히 알아보겠습니다. 이 수업은 매우 귀중한 수업입니다. 학생 여러분, 잘 들으십시오. 단계는 다음과 같습니다. 1. 먼저 컴퓨터에서 Excel 테이블을 연 다음 새 통합 문서를 만듭니다. 2. 다음으로 빈 워크시트에 다음 내용을 입력합니다. (그림과 같이) 3. 다음으로 [도구 모음]에서 [함수 삽입]을 클릭합니다.

See all articles

Pandas를 사용하여 Excel 파일을 읽고 데이터 가져오기 및 분석을 쉽게 구현

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제