pandas est une puissante bibliothèque de traitement de données python qui brille dans analyse de données, nettoyage et transformation. Sa structure de données flexible et ses fonctions riches en font un outil puissant pour le traitement des données.
Structure des données : DataFrame
DataFrame est la structure de données de base de Pandas, semblable à un tableau, composé de lignes et de colonnes. Chaque ligne représente un enregistrement de données et chaque colonne représente un attribut de l'enregistrement.
Chargement et lecture des données
pd.read_csv("filename.csv")
pd.read_<code>pd.read_<strong class="keylink">excel</strong>("filename.xlsx")
excel
pd.read_<strong class="keylink">JSON</strong>("filename.<strong class="keylink">js</strong>on")
pd.read_
json")
df.fillna(0)
df.drop_duplicates()
df["column"].astype(int)
(Convertir une colonne du type objet en type entier)
pd.merge(df1, df2, on="column_name")
pd.concat([df1, df2], axis=1)
df.groupby("column_name").agg({"column_name": "mean"})
(Regrouper par colonne et calculer la moyenne)
df.describe()
df.plot()
df.agg({"column_name": "sum"})
(calculer la somme d'une colonne)
df[df["column_name"] > 10]
df[df["column_name"].str.cont<strong class="keylink">ai</strong>ns("pattern")]
df[df["column_name"].str.cont
aidf["new_column"] = df["old_column"].apply(my_funct<strong class="keylink">io</strong>n)
ns("pattern")]Fonction personnalisée : df["new_column"] = df["old_column"].apply(my_funct
io
Exemple
import pandas as pd
# 从 CSV 文件加载数据
df = pd.read_csv("sales_data.csv")
# 清洗数据
df.fillna(0, inplace=True) # 填充缺失值
# 转换数据
df["sale_date"] = pd.to_datetime(df["sale_date"]) # 将日期列转换为 datetime 类型
# 分析数据
print(df.describe()) # 显示描述性统计
# 可视化数据
df.plot(x="sale_date", y="sales") # 生成折线图
# 导出数据
df.to_csv("sales_data_processed.csv", index=False) # 导出为 CSV 文件
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!