Verwenden Sie die Pandas-Bibliothek, um CSV-Dateien schnell zu lesen: Installieren Sie zuerst Pandas. Verwenden Sie die Funktion read_csv(), um die CSV-Datei zu lesen und in einem Datenrahmen zu speichern. Verwenden Sie die Funktion head(), um die ersten Zeilen des Datenrahmens anzuzeigen. Durch Gruppieren des Datenrahmens und Verwenden der Funktion sum() können Sie schnell den Gesamtumsatz für jedes Produkt berechnen.
So lesen Sie CSV-Dateien schnell mit Python
CSV-Dateien (durch Kommas getrennte Werte) sind ein einfaches, leicht zu analysierendes Datenspeicher- und Austauschformat. In Python können wir die leistungsstarke Pandas-Bibliothek nutzen, um CSV-Dateien schnell und effizient zu lesen und zu verarbeiten.
Pandas installieren
Bevor Sie beginnen, stellen Sie sicher, dass Pandas installiert ist. Führen Sie den folgenden Befehl in der Befehlszeile aus:
pip install pandas
CSV-Datei lesen
Um eine CSV-Datei mit Pandas zu lesen, können wir die Funktion read_csv()
verwenden. Diese Funktion akzeptiert einen Dateinamen oder Dateipfad als Argument und gibt ein Pandas-Objekt zurück, das als Datenrahmen bezeichnet wird. Ein Datenrahmen ist eine tabellenartige Datenstruktur, die sich wie eine Tabellenkalkulation verhält. read_csv()
函数。这个函数接受一个文件名或文件路径作为参数,并返回一个称为数据框的Pandas对象。数据框是一种表格状的数据结构,其行为类似于电子表格。
以下是如何读取CSV文件的示例代码:
import pandas as pd # 读取CSV文件并将其存储在名为df的数据框中 df = pd.read_csv('my_data.csv')
查看数据框
可以使用head()
函数查看数据框的前几行:
# 查看数据框的前五行 df.head()
实战案例
假设我们有一个名为sales.csv
Sie können die Funktion head() verwenden, um die ersten Zeilen der Datei anzuzeigen Datenrahmen: | Praktischer Fall | |
---|---|---|
Datum | Produkt | |
2023-01. -01 | ||
100 | 2023-01-02 |