-
read_csv()
を使用して CSV ファイルを読み取ります: df = pd.read_csv("data.csv")
- 欠損値の処理:
- 欠損値の削除:
df = df.dropna()
- 欠損値を埋める:
df["column_name"].fillna(value)
- データ型の変換:
df["column_name"] = df["column_name"].astype(dtype)
-
並べ替えとグループ化:
- 並べ替え:
df.sort_values(by="column_name")
- グループ:
groupby_object = df.groupby(by="column_name")
2. データ分析
###統計###
-
describe()- : データの基本統計を表示します
mean()- : 平均値を計算します
std()- : 標準偏差の計算
グラフを描く:
-
plot()- : 折れ線グラフや散布図などのさまざまな種類のグラフを生成します
bar()- :棒グラフの生成
pie()- :円グラフの生成
データ集約:
-
agg()- : グループ化されたデータに集計関数を適用します
pivot_table()- : データを要約および分析するためのクロス集計を作成します
3. データ操作
インデックス- とスライス:
loc[index_values]- : インデックス値によるデータの取得
iloc[index_values]- : インデックス位置によるデータの取得
query()- : 条件によるデータのフィルタリング
データ操作:
-
append()- :データをDataFrameに追加します
merge()- : 2 つ以上の DataFrame をマージします
concat()- : 複数の DataFrame を連結します
データ変換:
-
apply()- :関数を行ごとまたは列ごとに適用します
lambda()- : データを変換する匿名関数を作成します
4.高度なスキル
カスタム関数: カスタム関数を作成して使用し、
pandas-
の機能を拡張します。
ベクトル化操作: NumPy のベクトル化関数を使用して効率を向上させる
- データクリーニング:
-
str.strip()- :
string
から空白文字 を削除します
str.replace()- : 文字列または
正規表現
内の文字を置換します。
str. lower()- : 文字列を小文字に変換します
5. 事例の適用
顧客データの分析: 顧客の行動、購入パターン、傾向を理解する
- 財務データの処理: 財務指標の計算、株式パフォーマンスの分析
- 科学データの探索: センサー データの処理と実験結果の分析
-
以上がデータ処理初心者もすぐに上達できるPython Pandas実践ドリル!の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。