Beginnen Sie schnell mit Python Pandas und lernen Sie, wie Sie Daten wie ein Koch verarbeiten!

WBOY
Freigeben: 2024-03-20 16:01:42
nach vorne
526 Leute haben es durchsucht

Python Pandas 入门速成,庖丁解牛式数据处理!

pandas ist eine leistungsstarke Python-Datenverarbeitungsbibliothek, die sich durch Datenanalyse, Bereinigung und Transformation auszeichnet. Seine flexible Datenstruktur und umfangreiche Funktionen machen es zu einem leistungsstarken Werkzeug für die Datenverarbeitung.

Datenstruktur: DataFrame

DataFrame ist die Kerndatenstruktur von Pandas, ähnlich einer Tabelle, bestehend aus Zeilen und Spalten. Jede Zeile stellt einen Datensatz dar und jede Spalte stellt ein Attribut des Datensatzes dar.

Laden und Lesen von Daten

  • Aus CSV-Datei laden: pd.read_csv("filename.csv")
  • Aus Excel-Datei laden: pd.read_<code>pd.read_<strong class="keylink">excel</strong>("filename.xlsx")excel
  • ("filename.xlsx")
  • Aus JSON-Datei laden: pd.read_<strong class="keylink">JSON</strong>("filename.<strong class="keylink">js</strong>on")pd.read_
  • JSON
("filename.

json")

  • Datenbereinigung df.fillna(0)
  • Fehlende Werte behandeln: (fehlende Werte mit 0 füllen)df.drop_duplicates()
  • Duplikate entfernen:df["column"].astype(int)
Typkonvertierung:

(Konvertieren einer Spalte vom Objekttyp in den Ganzzahltyp)

  • Datenkonvertierung pd.merge(df1, df2, on="column_name")
  • Datenrahmen zusammenführen: pd.concat([df1, df2], axis=1)
  • DataFrame beitreten: (Nach Spalte verbinden)df.groupby("column_name").agg({"column_name": "mean"})
Gruppenoperation:

(Nach Spalte gruppieren und Durchschnitt berechnen)

  • Datenanalyse df.describe()
  • Beschreibende Statistik: (Mittelwert, Median, Standardabweichung usw. berechnen) df.plot()
  • Visualisierung: (Balkendiagramme, Liniendiagramme usw. generieren) df.agg({"column_name": "sum"})
Datenaggregation:

(Berechnen Sie die Summe einer Spalte)

  • Erweiterte Funktionen df[df["column_name"] > 10]
  • Bedingte Filterung: df[df["column_name"].str.cont<strong class="keylink">ai</strong>ns("pattern")]
  • Regulärer Ausdruck: df[df["column_name"].str.contaidf["new_column"] = df["old_column"].apply(my_funct<strong class="keylink">io</strong>n)ns("pattern")]

Benutzerdefinierte Funktion: df["new_column"] = df["old_column"].apply(my_functio

n)

Beispiel

import pandas as pd

# 从 CSV 文件加载数据
df = pd.read_csv("sales_data.csv")

# 清洗数据
df.fillna(0, inplace=True) # 填充缺失值

# 转换数据
df["sale_date"] = pd.to_datetime(df["sale_date"]) # 将日期列转换为 datetime 类型

# 分析数据
print(df.describe()) # 显示描述性统计

# 可视化数据
df.plot(x="sale_date", y="sales") # 生成折线图

# 导出数据
df.to_csv("sales_data_processed.csv", index=False) # 导出为 CSV 文件
Nach dem Login kopieren

Fazit🎜🎜 🎜Pandas macht die Arbeit mit Daten zum Kinderspiel und seine leistungsstarken Funktionen und flexiblen Datenstrukturen machen es zu einem unverzichtbaren 🎜Tool🎜 für Datenwissenschaftler und -analysten. Wenn Sie die Grundlagen von Pandas beherrschen, können Sie komplexe Datensätze schnell und einfach verarbeiten und analysieren. 🎜

Das obige ist der detaillierte Inhalt vonBeginnen Sie schnell mit Python Pandas und lernen Sie, wie Sie Daten wie ein Koch verarbeiten!. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
Quelle:lsjlt.com
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage
Über uns Haftungsausschluss Sitemap
Chinesische PHP-Website:Online-PHP-Schulung für das Gemeinwohl,Helfen Sie PHP-Lernenden, sich schnell weiterzuentwickeln!