pandas は、データ分析、クリーニング、変換に優れた強力な python データ処理ライブラリです。柔軟な データ構造 と豊富な機能により、データ処理のための強力なツールになります。
データ構造: データフレーム
DataFrame は Pandas の中核となるデータ構造で、テーブルに似ており、行と列で構成されます。各行はデータ レコードを表し、各列はレコードの属性を表します。
データのロードと読み取り
pd.read_csv("filename.csv")
pd.read_<strong class="keylink">excel</strong>("filename.xlsx")
pd.read_<strong class="keylink">JSON</strong>("filename.<strong class="keylink">js</strong>on")
データクリーニング
df.fillna(0)
(欠損値を0で埋める)df.drop_duplicates()
df["column"].astype(int)
(列をオブジェクト型から整数型に変換します)データ変換
pd.merge(df1, df2, on="column_name")
pd.concat([df1, df2], axis=1)
(列ごとに接続)df.groupby("column_name").agg({"column_name": "mean"})
(列ごとにグループ化し、平均を計算します)記述統計:
視覚化:
データ集計:
df[df["column_name"] > 10]
ns("pattern")]
df["new_column"] = df["old_column"].apply(my_funct<strong class="keylink">io</strong>n)
Pandas はデータ処理を簡単にし、その強力な機能と柔軟なデータ構造により、データ サイエンティストやアナリストにとって必須の ツールとなっています。 Pandas の基本をマスターすると、複雑なデータセットを迅速かつ簡単に処理および分析できます。
以上がPython Pandas をすぐに使い始めて、料理人のようにデータを処理する方法を学びましょう。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。