Démarrez rapidement avec Python Pandas et apprenez à traiter les données comme un cuisinier !

WBOY
Libérer: 2024-03-20 16:01:42
avant
527 Les gens l'ont consulté

Python Pandas 入门速成,庖丁解牛式数据处理!

pandas est une puissante bibliothèque de traitement de données python qui brille dans analyse de données, nettoyage et transformation. Sa structure de données flexible et ses fonctions riches en font un outil puissant pour le traitement des données.

Structure des données : DataFrame

DataFrame est la structure de données de base de Pandas, semblable à un tableau, composé de lignes et de colonnes. Chaque ligne représente un enregistrement de données et chaque colonne représente un attribut de l'enregistrement.

Chargement et lecture des données

  • Charger à partir d'un fichier CSV : pd.read_csv("filename.csv")
  • Charger depuis un fichier Excel : pd.read_<code>pd.read_<strong class="keylink">excel</strong>("filename.xlsx")excel
  • ("filename.xlsx")
  • Charger depuis le fichier JSON : pd.read_<strong class="keylink">JSON</strong>("filename.<strong class="keylink">js</strong>on")pd.read_
  • JSON
("filename.

json")

  • Nettoyage des données df.fillna(0)
  • Gérer les valeurs manquantes : (remplir les valeurs manquantes avec 0)df.drop_duplicates()
  • Supprimer les doublons :df["column"].astype(int)
Conversion de type :

(Convertir une colonne du type objet en type entier)

  • Conversion de données pd.merge(df1, df2, on="column_name")
  • Fusionner DataFrame : pd.concat([df1, df2], axis=1)
  • Rejoindre DataFrame : (Rejoindre par colonne)df.groupby("column_name").agg({"column_name": "mean"})
Opération de groupe :

(Regrouper par colonne et calculer la moyenne)

  • Analyse des données df.describe()
  • Statistiques descriptives : (calculer la moyenne, la médiane, l'écart type, etc.) df.plot()
  • Visualisation : (générer des graphiques à barres, des graphiques linéaires, etc.) df.agg({"column_name": "sum"})
Agrégation de données :

(calculer la somme d'une colonne)

  • Fonctionnalités avancées df[df["column_name"] > 10]
  • Filtrage conditionnel : df[df["column_name"].str.cont<strong class="keylink">ai</strong>ns("pattern")]
  • Expression régulière : df[df["column_name"].str.contaidf["new_column"] = df["old_column"].apply(my_funct<strong class="keylink">io</strong>n)ns("pattern")]

Fonction personnalisée : df["new_column"] = df["old_column"].apply(my_functio

n)

Exemple

import pandas as pd

# 从 CSV 文件加载数据
df = pd.read_csv("sales_data.csv")

# 清洗数据
df.fillna(0, inplace=True) # 填充缺失值

# 转换数据
df["sale_date"] = pd.to_datetime(df["sale_date"]) # 将日期列转换为 datetime 类型

# 分析数据
print(df.describe()) # 显示描述性统计

# 可视化数据
df.plot(x="sale_date", y="sales") # 生成折线图

# 导出数据
df.to_csv("sales_data_processed.csv", index=False) # 导出为 CSV 文件
Copier après la connexion

Conclusion🎜🎜 🎜Pandas facilite le travail avec les données, et ses fonctionnalités puissantes et ses structures de données flexibles en font un 🎜outil🎜 incontournable pour les data scientists et les analystes. En maîtrisant les bases de Pandas, vous pouvez traiter et analyser rapidement et facilement des ensembles de données complexes. 🎜

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:lsjlt.com
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal
À propos de nous Clause de non-responsabilité Sitemap
Site Web PHP chinois:Formation PHP en ligne sur le bien-être public,Aidez les apprenants PHP à grandir rapidement!