pandas ialah perpustakaan pemprosesan data python yang berkuasa yang bersinar dalam analisis data, pembersihan dan transformasi. struktur data yang fleksibel dan fungsi yang kaya menjadikannya alat yang berkuasa untuk pemprosesan data.
Struktur data: DataFrame
DataFrame ialah struktur data teras Panda, serupa dengan jadual, yang terdiri daripada baris dan lajur. Setiap baris mewakili rekod data, dan setiap lajur mewakili atribut rekod.
Memuat dan membaca data
pd.read_csv("filename.csv")
pd.read_<strong class="keylink">excel</strong>("filename.xlsx")
excelpd.read_<strong class="keylink">JSON</strong>("filename.<strong class="keylink">js</strong>on")
pd.read_
json")
df.fillna(0)
df.drop_duplicates()
df["column"].astype(int)
(Tukar lajur daripada jenis objek kepada jenis integer)
pd.merge(df1, df2, on="column_name")
pd.concat([df1, df2], axis=1)
df.groupby("column_name").agg({"column_name": "mean"})
(Kumpulkan mengikut lajur dan kira purata)
df.describe()
df.plot()
df.agg({"column_name": "sum"})
(kira jumlah lajur)
df[df["column_name"] > 10]
df[df["column_name"].str.cont<strong class="keylink">ai</strong>ns("pattern")]
df["new_column"] = df["old_column"].apply(my_funct<strong class="keylink">io</strong>n)
ns("corak")]Fungsi tersuai:
Contoh
import pandas as pd
# 从 CSV 文件加载数据
df = pd.read_csv("sales_data.csv")
# 清洗数据
df.fillna(0, inplace=True) # 填充缺失值
# 转换数据
df["sale_date"] = pd.to_datetime(df["sale_date"]) # 将日期列转换为 datetime 类型
# 分析数据
print(df.describe()) # 显示描述性统计
# 可视化数据
df.plot(x="sale_date", y="sales") # 生成折线图
# 导出数据
df.to_csv("sales_data_processed.csv", index=False) # 导出为 CSV 文件
Atas ialah kandungan terperinci Bermula dengan cepat dengan Python Pandas, dan pelajari cara memproses data seperti tukang masak!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!