1. ツールの準備
データ分析に適したツール: anaconda このチュートリアルでは、ブラウザーで実行される win10 システムで anaconda3 jupyter ツールを使用します。
ダウンロードURL: https://www.anaconda.com/
起動方法
スタートメニューからanacondaプロンプトのコマンドラインウィンドウを開きます
プロジェクトが保存されているディレクトリを入力してくださいが見つかったら、ディレクトリを自分で設定します
コマンドjupyter Notebookを使用してブラウザを開きます
2.シリーズタイプ
インデックスが作成されると、内部の値は変更できません個別に
1. Series オブジェクトを作成します
リストまたは配列を通じてオブジェクトを作成します
import pandas as pd import numpy as np users=['张三','李四','王老五'] series1=pd.Series(users) print(series1)
上記のコードの結果:
0 张三 1 李四 2 王老五 dtype: object
辞書を通して系列オブジェクトを作成します
users={'张三':20,'李四':25,'王五':21} series2=pd.Series(users) print(series2)
上記コード結果:
张三 20 李四 25 王五 21 dtype: int64
2. シリーズのシーケンスを取得します
print(series2.index)
上記のコードの結果:
Index(['张三', '李四', '王五'], dtype='object')
3. シリーズの値を取得します
print(series2.values)
上記のコードの結果:
[20 25 21]
4. 特定の値の結果を取得します
print(series2.values) print(series2[1]) print(series2['王五'])
上記コードの結果:
25 21
上記2つのSeriesの値は任意の方法で取得できます
5.
pd.date_range('2022-10-01',periods=4,freq='M')
6. 時間間隔インデックス
pd.TimedeltaIndex([10,12,14,16],unit="D")
TimedeltaIndex(['10 days', '12 days', '14 days', '16 days'], dtype='timedelta64[ns]', freq=None)
7.索引取值
import numpy as np import pandas as pd pd=pd.DataFrame(np.random.randint(1,100,(4,5)),index=['A','B','C','D']) # pd['A':'C']#通过索引名称取值,结果包含最后一个 pd[0:3]#通过索引下标取值,结果不包含最后一个
8. 条件索引
conditon=series>50 series[conditon] 或 series[series>50]
以上代码结果:
0 1 2 3 4 A 84.0 63.0 76.0 72.0 77.0 B NaN 96.0 NaN 65.0 NaN C NaN NaN NaN 81.0 NaN D 74.0 89.0 NaN NaN 53.0
以上がPandas データ分析を使用したシリーズの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。