Pandas ist ein häufig verwendetes Datenverarbeitungs- und Analysetool in Python. Es bietet eine Reihe praktischer Methoden zum Lesen und Verarbeiten von Excel-Dateien. In diesem Artikel werden mehrere gängige Methoden für Pandas zum Lesen von Excel-Dateien vorgestellt und spezifische Codebeispiele bereitgestellt, um den Lesern zu helfen, diese besser zu verstehen und anzuwenden.
1. Verwenden Sie die Funktion read_excel() von Pandas, um Excel-Dateien zu lesen.
Pandas bietet die Funktion read_excel(), mit der Excel-Dateien direkt gelesen und in DataFrame-Objekte konvertiert werden können. Die grundlegende Verwendung dieser Funktion ist wie folgt:
import pandas as pd # 读取Excel文件 df = pd.read_excel('filename.xlsx', sheetname='sheet1')
Unter anderem ist „Dateiname.xlsx“ der Name der zu lesenden Excel-Datei, der ein relativer Pfad oder ein absoluter Pfad sein kann. Der Parameter sheetname wird verwendet, um den Namen des zu lesenden Arbeitsblatts anzugeben, bei dem es sich um einen bestimmten Arbeitsblattnamen oder Index handeln kann.
Zur Vereinfachung der Demonstration erstellen wir eine Beispiel-Excel-Datei mit dem Namen data.xlsx
mit folgendem Inhalt:
Name Alter Geschlecht
Zhang San 25 männlich
Li Si 30 weiblich
Wang Wu 28 männlich
Als nächstes verwenden wir read_excel() Funktion Lesen und drucken Sie die Daten aus:
import pandas as pd # 读取Excel文件 df = pd.read_excel('data.xlsx', sheetname='Sheet1') # 打印数据 print(df)
Die laufenden Ergebnisse lauten wie folgt:
Name Alter Geschlecht
0 Zhang San 25 männlich
1 Li Si 30 weiblich
2 Wang Wu 28 männlich
Nachdem Sie die Excel-Datei gelesen haben, können Sie Führen Sie verschiedene Vorgänge für die Datenverarbeitung und -analyse des DataFrame-Objekts durch.
2. Daten aus mehreren Arbeitsblättern lesen
Wenn eine Excel-Datei mehrere Arbeitsblätter enthält, können Sie die Daten des angegebenen Arbeitsblatts lesen, indem Sie den Parameter sheetname angeben. Zu diesem Zeitpunkt gibt die Funktion read_excel() ein Wörterbuch mit dem Arbeitsblattnamen als Schlüssel und dem entsprechenden DataFrame-Objekt als Wert zurück. Ein Beispiel ist wie folgt:
import pandas as pd # 读取Excel文件的所有工作表 dfs = pd.read_excel('filename.xlsx', sheetname=None) # 打印所有工作表的数据 for sheetname, df in dfs.items(): print(sheetname, ": ", df)
3. Geben Sie den Spaltenbereich an, um Daten zu lesen. Manchmal möchten wir möglicherweise nur einen Teil der Spaltendaten in der Excel-Datei lesen. Zu diesem Zeitpunkt können Sie den Bereich der zu lesenden Spalten einschränken, indem Sie den Parameter usecols angeben. Ein Beispiel ist wie folgt:
import pandas as pd # 读取Excel文件的指定列范围 df = pd.read_excel('filename.xlsx', usecols='A:C') # 打印数据 print(df)
Beim Lesen von Excel-Dateien stoßen Sie häufig auf Situationen, die Nullwerte enthalten. Pandas bietet die Funktion fillna(), um diese Situation bequem zu bewältigen. Ein Beispiel ist wie folgt:
import pandas as pd # 读取Excel文件并处理空值 df = pd.read_excel('filename.xlsx') df.fillna(value=0, inplace=True) # 打印数据 print(df)
Das obige ist der detaillierte Inhalt vonSo lesen Sie Excel-Dateien mit Pandas. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!