Python이 데이터 분석을 위해 Pandas를 사용하는 방법에 대한 자세한 설명

WBOY
풀어 주다: 2022-09-06 19:54:41
앞으로
3758명이 탐색했습니다.

【관련 추천: Python3 동영상 튜토리얼

Pandas은 데이터 분석을 위한 가장 인기 있는 Python 라이브러리입니다. C 또는 Python로 완전히 작성된 백엔드 소스 코드로 고도로 최적화된 성능을 제공합니다.

다음과 같은 방법으로 팬더의 데이터를 분석할 수 있습니다.

  • 1.Series

  • 2.Data Frame

Series

Series은 1차원(1-D)으로 정의됩니다. pandas 배열은 모든 데이터 유형을 저장하는 데 사용할 수 있습니다.

Code #1

Create Series

# 创建 Series 的程序

# 导入 Panda 库
import pandas as pd

# 使用数据和索引创建 Series
a = pd.Series(Data, index = Index)
로그인 후 복사

여기에서 data는 다음과 같습니다.

  • a 스칼라 값(정수값일 수 있음), 문자열
  • 은 키-값 쌍의 Python 사전일 수 있습니다.
  • A Ndarray

Note: 기본적으로 인덱스는 0, 1, 2, ...(n-1)에서 시작합니다. 여기서 n은 데이터 길이입니다.

Code #2

데이터에 스칼라 값이 포함된 경우 ​​

# 使用标量值创建 Series 的程序

# 数值数据
Data =[1, 3, 4, 5, 6, 2, 9]

# 使用默认索引值创建系列
s = pd.Series(Data)	

# 预定义的索引值
Index =['a', 'b', 'c', 'd', 'e', 'f', 'g']

# 创建具有预定义索引值的系列
si = pd.Series(Data, Index)
로그인 후 복사

Output:

기본 인덱스가 있는 스칼라 데이터

인덱스가 있는 스칼라 데이터

코드 #3

데이터에 사전

# 创建词典 Series 程序
dictionary ={'a':1, 'b':2, 'c':3, 'd':4, 'e':5}

# 创建字典类型 Series
sd = pd.Series(dictionary)
로그인 후 복사

Output:

사전 유형 데이터

Code #4

데이터에 Ndarray

# 创建 ndarray series 的程序

# 定义二维数组
Data =[[2, 3, 4], [5, 6, 7]]

# 创建一系列二维数组
snd = pd.Series(Data)
로그인 후 복사

Output이 포함된 경우:

Ndarray

데이터 DataFrame

DataFrames은 행과 열로 구성된 팬더에서 정의된 2차원(2-D) 데이터 구조입니다.

코드 #1

Create DataFrame

# 创建 DataFrame 的程序

# 导入库
import pandas as pd

# 使用数据创建 DataFrame
a = pd.DataFrame(Data)
로그인 후 복사

여기에서 데이터는 다음과 같습니다.

  • 하나 이상 Dictionaries
  • 하나 이상 Series
  • 2D-numpy Ndarray

코드 #2

데이터가 사전인 경우

# 使用两个字典创建数据框的程序

# 定义字典 1
dict1 ={'a':1, 'b':2, 'c':3, 'd':4}

# 定义字典 2
dict2 ={'a':5, 'b':6, 'c':7, 'd':8, 'e':9}

# 用 dict1 和 dict2 定义数据
Data = {'first':dict1, 'second':dict2}

# 创建数据框
df = pd.DataFrame(Data)
로그인 후 복사

Output:

두 개의 사전이 있는 DataFrame

Code #3

데이터가 시리즈인 경우

# 创建三个系列的Dataframe的程序
import pandas as pd

# 定义 series 1
s1 = pd.Series([1, 3, 4, 5, 6, 2, 9])

# 定义 series 2
s2 = pd.Series([1.1, 3.5, 4.7, 5.8, 2.9, 9.3])

# 定义 series 3
s3 = pd.Series(['a', 'b', 'c', 'd', 'e'])	

# 定义 Data
Data ={'first':s1, 'second':s2, 'third':s3}

# 创建 DataFrame
dfseries = pd.DataFrame(Data)
로그인 후 복사

출력:

세 시리즈의 DataFrame

코드 #4

데이터가 2D-numpy ndarray인 경우Note: 2D 배열의 DataFrame을 생성할 때 한 가지 제약 조건을 유지해야 합니다. 2D 배열의 크기는 동일하다.

# 从二维数组创建 DataFrame 的程序

# 导入库
import pandas as pd

# 定义 2d 数组 1
d1 =[[2, 3, 4], [5, 6, 7]]

# 定义 2d 数组 2
d2 =[[2, 4, 8], [1, 3, 9]]

# 定义 Data
Data ={'first': d1, 'second': d2}

# 创建 DataFrame
df2d = pd.DataFrame(Data)
로그인 후 복사

Output:

DataFrame with 2d ndarray

【관련 추천: Python3 비디오 튜토리얼

위 내용은 Python이 데이터 분석을 위해 Pandas를 사용하는 방법에 대한 자세한 설명의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨:
원천:jb51.net
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿