pandas ist eine wichtige Datenanalysebibliothek in Python, die das Lesen, Bereinigen und Verarbeiten von Daten vereinfachen kann. Sie ist mittlerweile zum Standard für Datenanalysearbeiten geworden. Bei der Datenanalyse ist Excel häufig eine der Datenquellen. In diesem Artikel wird daher eine schnelle Methode zum Lesen von Excel-Dateien mithilfe von Pandas vorgestellt.
Mehrere Vorteile der Verwendung von Pandas zum Lesen von Excel-Dateien:
Also, wie kann man Pandas zum Lesen von Excel-Dateien verwenden? Im Folgenden wird der gesamte Prozess vom Lesen von Excel-Dateien bis zur Datenbereinigung und -bearbeitung im Detail vorgestellt.
Zuerst müssen Sie die Pandas-Bibliothek und die zugehörigen abhängigen Bibliotheken installieren. Zur Installation können Sie die folgende Anweisung verwenden:
pip install pandas openpyxl
Nach der Installation der erforderlichen Bibliotheken können Sie Pandas direkt zum Lesen der Excel-Datei verwenden. Die Methode zum Lesen von Excel-Dateien mit Pandas ist flexibel. Sie können nur ein Blatt oder alle Blätter der Excel-Datei lesen. Gleichzeitig können Sie auch jede Spalte benennen, Datentypen definieren usw .
Verwenden Sie die Funktion pandas.read_excel
, um ein einzelnes Blatt aus einer Excel-Datei zu lesen. Wir haben beispielsweise eine Excel-Datei namens test. Wenn Sie alle Blätter in der Excel-Datei lesen müssen, können Sie den folgenden Code verwenden: pandas.read_excel
函数可以从Excel文件中读取单个sheet。例如,我们有一个名为test.xlsx的Excel文件,其中包含一个名为Sheet1的sheet,可以使用以下代码读取:
import pandas as pd df = pd.read_excel('test.xlsx', sheet_name='Sheet1')
如果我们需要读取Excel文件中的所有sheet,可以使用如下代码:
import pandas as pd xls = pd.read_excel('test.xlsx', sheet_name=None)
将sheet_name参数设置为None,则返回一个以sheet名称为键,以DataFrame为值的字典。
可以使用xls.keys()
来查看所有sheet的名称,以及使用xls.values()
import pandas as pd df = pd.read_excel('test.xlsx', sheet_name='Sheet1') df.rename(columns={'原列名':'新列名'}, inplace=True)
xls.keys()
verwenden, um die Namen aller Blätter anzuzeigen, und xls.values()
verwenden, um den Inhalt aller Blätter anzuzeigen. Spalten umbenennen
import pandas as pd df = pd.read_excel('test.xlsx', sheet_name='Sheet1') df.to_csv('output.csv')
Daten in eine Datei schreiben
Mit Pandas können Sie Daten in Excel-Dateien ganz einfach in verschiedene Dateitypen schreiben, einschließlich CSV , SQL-Datenbank usw. Nehmen Sie als Beispiel das Schreiben von Daten aus einer Excel-Datei in eine CSV-Datei. Der Beispielcode lautet wie folgt:rrreee
Speichern Sie die in Excel gelesenen Daten in einem DataFrame und verwenden Sie dann die to_csv-Funktion des DataFrame, um sie direkt zu schreiben Daten in die CSV-Datei. 🎜🎜Anhand der obigen Beispiele hoffe ich, dass jeder die Überlegenheit von Pandas beim Lesen und Verarbeiten von Excel-Daten verstehen und schnell mit dieser Bibliothek beginnen und diese Fähigkeit bei nachfolgenden Datenanalysearbeiten nutzen kann, um Daten elegant zu verarbeiten. 🎜Das obige ist der detaillierte Inhalt vonSchneller Einstieg in Pandas: Eine schnelle Möglichkeit, diese Bibliothek zum Lesen von Excel-Dateien zu verwenden. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!