ホームページ > バックエンド開発 > Python チュートリアル > Python がデータ分析に Pandas を使用する方法の詳細な説明

Python がデータ分析に Pandas を使用する方法の詳細な説明

WBOY
リリース: 2022-09-06 19:54:41
転載
3827 人が閲覧しました

[関連する推奨事項: Python3 ビデオ チュートリアル ]

Pandas はデータ分析 Python で最も人気があります図書館。バックエンドのソース コード全体が C または Python で記述されており、高度に最適化されたパフォーマンスを提供します。

次の方法でパンダのデータを分析できます:

  • 1.Series

  • 2.Data Frame

Series

Series は、pandas で定義された 1 次元 (1-D) 配列であり、任意のデータ型を格納するために使用できます。

コード#1

シリーズの作成

# 创建 Series 的程序

# 导入 Panda 库
import pandas as pd

# 使用数据和索引创建 Series
a = pd.Series(Data, index = Index)
ログイン後にコピー

ここで、data は次のようになります:

  • A スカラー値 (integerValue または文字列
  • は、キーと値のペアの Python 辞書
  • a Ndarray

: デフォルトでは、インデックスは 0、1、2、...(n-1) から始まります。n はデータ長です。 。

#コード#2

#データにスカラー値が含まれる場合

# 使用标量值创建 Series 的程序

# 数值数据
Data =[1, 3, 4, 5, 6, 2, 9]

# 使用默认索引值创建系列
s = pd.Series(Data)	

# 预定义的索引值
Index =['a', 'b', 'c', 'd', 'e', 'f', 'g']

# 创建具有预定义索引值的系列
si = pd.Series(Data, Index)
ログイン後にコピー
#出力

:

#デフォルトのインデックスを使用したスカラー データ

インデックスを使用したスカラー データ

#コード #3

Whenデータには辞書が含まれています

# 创建词典 Series 程序
dictionary ={'a':1, 'b':2, 'c':3, 'd':4, 'e':5}

# 创建字典类型 Series
sd = pd.Series(dictionary)
ログイン後にコピー

出力:

辞書型データ

コード #4

データに Ndarray が含まれる場合

# 创建 ndarray series 的程序

# 定义二维数组
Data =[[2, 3, 4], [5, 6, 7]]

# 创建一系列二维数组
snd = pd.Series(Data)
ログイン後にコピー

出力:

データを Ndarray として

Data Frame

DataFrames

は、pandas で定義された 2 次元 (2-D) データ構造であり、行と列で構成されます。

コード#1

データフレームの作成

# 创建 DataFrame 的程序

# 导入库
import pandas as pd

# 使用数据创建 DataFrame
a = pd.DataFrame(Data)
ログイン後にコピー

ここで、データは次のとおりです:

これは 1 つ以上です

Dictionary

    1 つ以上の
  • Series
  • 2D-numpy Ndarray
  • コード # 2
  • データが辞書の場合

# 使用两个字典创建数据框的程序

# 定义字典 1
dict1 ={'a':1, 'b':2, 'c':3, 'd':4}

# 定义字典 2
dict2 ={'a':5, 'b':6, 'c':7, 'd':8, 'e':9}

# 用 dict1 和 dict2 定义数据
Data = {'first':dict1, 'second':dict2}

# 创建数据框
df = pd.DataFrame(Data)
ログイン後にコピー

出力:

データフレーム2 つの辞書を使用した場合

コード#3

データがシリーズの場合

# 创建三个系列的Dataframe的程序
import pandas as pd

# 定义 series 1
s1 = pd.Series([1, 3, 4, 5, 6, 2, 9])

# 定义 series 2
s2 = pd.Series([1.1, 3.5, 4.7, 5.8, 2.9, 9.3])

# 定义 series 3
s3 = pd.Series(['a', 'b', 'c', 'd', 'e'])	

# 定义 Data
Data ={'first':s1, 'second':s2, 'third':s3}

# 创建 DataFrame
dfseries = pd.DataFrame(Data)
ログイン後にコピー

出力:

3 シリーズの DataFrame

Code#4

データが 2D-numpy ndarray の場合

: 2D 配列の DataFrame を作成するときは、1 つの制約を維持する必要があります。2D 配列の次元は同じである必要があります。

# 从二维数组创建 DataFrame 的程序

# 导入库
import pandas as pd

# 定义 2d 数组 1
d1 =[[2, 3, 4], [5, 6, 7]]

# 定义 2d 数组 2
d2 =[[2, 4, 8], [1, 3, 9]]

# 定义 Data
Data ={'first': d1, 'second': d2}

# 创建 DataFrame
df2d = pd.DataFrame(Data)
ログイン後にコピー
出力:

2D ndarrayを使用したDataFrame

[関連する推奨事項:Python3ビデオチュートリアル

]

以上がPython がデータ分析に Pandas を使用する方法の詳細な説明の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル:
ソース:jb51.net
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート