So lesen Sie Excel in Pandas: 1. Lesen Sie die gesamte Excel-Datei. 3. Lesen Sie mehrere Arbeitsblätter. 4. Geben Sie fehlende Werte und leere Werte an. Es lohnt sich zu warten. Detaillierte Einführung: 1. Um die gesamte Excel-Datei zu lesen, können Sie die „read_excel()“-Methode von Pandas verwenden. Diese Methode erfordert die Angabe des Dateipfads und des Arbeitsblattnamens Sie benötigen das Lesen bestimmter Arbeitsblätter in Excel-Dateien und mehr.
Das Betriebssystem dieses Tutorials: Windows 10-System, DELL G3-Computer.
Pandas ist eine beliebte Python-Datenanalysebibliothek, die mehrere Methoden zum Lesen von Excel-Dateien bietet. Im Folgenden finden Sie gängige Methoden zum Lesen von Excel-Dateien mit Pandas:
1. Lesen Sie die gesamte Excel-Datei.
Sie können die read_excel()-Methode von Pandas verwenden, um die gesamte Excel-Datei zu lesen. Dazu müssen Sie den Dateipfad und den Arbeitsblattnamen angeben.
Beispielcode:
import pandas as pd df = pd.read_excel('file_path.xlsx', sheet_name='Sheet1') # 读取名为'Sheet1'的工作表
2. Lesen Sie das angegebene Arbeitsblatt
Wenn Sie nur ein bestimmtes Arbeitsblatt in der Excel-Datei lesen müssen, können Sie den Parameter sheet_name in der Methode read_excel() angeben.
Beispielcode:
import pandas as pd df = pd.read_excel('file_path.xlsx', sheet_name='Sheet2') # 读取名为'Sheet2'的工作表
3. Mehrere Arbeitsblätter lesen
Wenn Sie mehrere Arbeitsblätter in einer Excel-Datei lesen möchten, können Sie den Parameter sheet_name in der Methode read_excel() verwenden, um die Namen mehrerer Arbeitsblätter anzugeben Datenrahmenobjekte.
Beispielcode:
import pandas as pd dfs = pd.read_excel('file_path.xlsx', sheet_name=['Sheet1', 'Sheet2']) # 获取名为'Sheet1'和'Sheet2'的两个数据框对象
4. Geben Sie Spaltennamen und Indexspalten an
Standardmäßig behandelt die Methode read_excel() die erste Zeile als Spaltennamen und die erste Spalte als Indexspalte. Wenn Sie Spaltennamen und Indexspalten angeben möchten, können Sie die Parameter header und index_col verwenden.
Beispielcode:
import pandas as pd df = pd.read_excel('file_path.xlsx', header=1, index_col=0) # 将第一行视为列名,将第一列视为索引列
5. Umgang mit fehlenden und leeren Werten
Standardmäßig behandelt die Methode read_excel() leere Zellen als NaN-Werte. Wenn Sie andere Werte für die Verarbeitung von Nullwerten angeben möchten, können Sie den Parameter na_values verwenden. Zusätzlich können fehlende Werte mit der Methode fillna() aufgefüllt werden.
Beispielcode:
import pandas as pd df = pd.read_excel('file_path.xlsx', na_values='N/A') # 将空单元格视为NaN值,但将'N/A'视为一个特殊值 df = df.fillna(0) # 填充缺失值为0
Das obige ist der detaillierte Inhalt vonWie man Excel mit Pandas liest. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!