Datenanalysetool: Beherrschen Sie die Fähigkeiten zum Ändern von Spaltennamen in Pandas
Einführung:
Während des Datenanalyseprozesses stoßen wir häufig auf Situationen, in denen wir die Spaltennamen des Datensatzes ändern müssen. Pandas ist eine häufig verwendete Datenverarbeitungsbibliothek in Python, die flexible und leistungsstarke Funktionen zum Verarbeiten und Analysieren von Daten bietet. Heute konzentrieren wir uns auf die Techniken zum Ändern von Spaltennamen in Pandas und demonstrieren sie anhand spezifischer Codebeispiele.
1. Sehen Sie sich die vorhandenen Spaltennamen an
Zuerst müssen wir die Spaltennamen des aktuellen Datensatzes verstehen. Verwenden Sie in Pandas df.columns
, um die Spaltennamen des DataFrame anzuzeigen. Zum Beispiel haben wir den folgenden Datenrahmen df: df.columns
可以查看数据框(DataFrame)的列名。例如,我们有如下数据框df:
import pandas as pd
data = {'A': [1, 2, 3],
'B': [4, 5, 6],
'C': [7, 8, 9]}
df = pd.DataFrame(data)
Nach dem Login kopieren
我们可以使用df.columns
print(df.columns)
Nach dem Login kopieren
Nach dem Login kopieren
Nach dem Login kopieren
Nach dem Login kopieren
Wir können
df.columns
verwenden, um die Spaltennamen von df anzuzeigen:
Index(['A', 'B', 'C'], dtype='object')
Nach dem Login kopieren
Die laufenden Ergebnisse lauten wie folgt:
df.columns = ['New_A', 'B', 'C']
Nach dem Login kopieren
2. Ändern Sie die Spaltennamen
Spaltennamen direkt ändern
In Pandas können wir Spaltennamen direkt ändern, indem wir Werte zuweisen. Zum Beispiel möchten wir den Spaltennamen „A“ in „Neu_A“ ändern:
print(df.columns)
Nach dem Login kopieren
Nach dem Login kopieren
Nach dem Login kopieren
Nach dem Login kopieren
Überprüfen Sie nach dem Ausführen den Spaltennamen von df erneut:
Index(['New_A', 'B', 'C'], dtype='object')
Nach dem Login kopieren
Die laufenden Ergebnisse lauten wie folgt:
df = df.rename(columns={'B': 'New_B'})
Nach dem Login kopieren
Auf diese Weise haben wir kann alle erforderlichen Änderungen vornehmen. Die Spaltennamen werden alle auf einmal geändert.
Verwenden Sie die Funktion rename(), um Spaltennamen zu ändern
Neben der direkten Zuweisung von Werten zum Ändern von Spaltennamen bietet Pandas auch die Funktion rename() zum Ändern von Spaltennamen. Diese Methode ist flexibler und wir können einige Spaltennamen selektiv ändern. Wenn wir beispielsweise den Spaltennamen „B“ in „Neu_B“ ändern, können wir den folgenden Code verwenden:
print(df.columns)
Nach dem Login kopieren
Nach dem Login kopieren
Nach dem Login kopieren
Nach dem Login kopieren
Überprüfen Sie nach dem Ausführen den Spaltennamen von df erneut:
Index(['New_A', 'New_B', 'C'], dtype='object')
Nach dem Login kopieren
Das Ergebnis der Ausführung lautet wie folgt:
df.columns = df.columns.map(lambda x: 'New_' + x)
Nach dem Login kopieren
Auf diese Weise ändern wir nur den angegebenen Spaltennamen, ohne dass sich dies auf die Benennung anderer Spaltennamen auswirkt.
Verwenden Sie die Funktion „map()“, um einen Teil des Spaltennamens zu ändern.
Manchmal müssen wir den Spaltennamen möglicherweise teilweise ändern, z. B. durch Hinzufügen eines Präfixes vor dem Spaltennamen. Verwenden Sie die Funktion „map()“, um Teilspaltennamen zu bearbeiten. Wenn wir beispielsweise das Präfix „New_“ vor dem Spaltennamen hinzufügen, können wir den folgenden Code verwenden:
print(df.columns)
Nach dem Login kopieren
Nach dem Login kopieren
Nach dem Login kopieren
Nach dem Login kopieren
Überprüfen Sie nach dem Ausführen den Spaltennamen von df erneut:
Index(['New_New_A', 'New_New_B', 'New_C'], dtype='object')
Nach dem Login kopieren
Das Ergebnis der Ausführung lautet wie folgt:
rrreee
Auf diese Weise können wir die Spalten vergleichen und flexible Teiländerungen am Namen vornehmen.
3. Anwendungsszenarien
Die Beherrschung der Fähigkeiten zum Ändern von Spaltennamen in Pandas ist für Datenanalyseaufgaben sehr wichtig. Im Folgenden finden Sie Beispiele für verschiedene Anwendungsszenarien:
- Datenbereinigung: Während des Datenbereinigungsprozesses ist es häufig erforderlich, Spaltennamen zu standardisieren und nicht standardmäßige Spaltennamen in einheitliche Benennungsstandards umzuwandeln.
- Datenzusammenführung: Wenn Sie die Funktion merge() oder join() zum Zusammenführen von Daten verwenden, ist es häufig erforderlich, die Namen der zusammengeführten Spalten zu ändern, um Spalten aus verschiedenen Datenquellen zu unterscheiden.
- Datenexport: Beim Exportieren von Daten in Excel- oder CSV-Dateien können wir die Spaltennamen ändern, um sie aussagekräftiger zu gestalten und die Lesbarkeit der Datei zu verbessern.
Zusammenfassung:
Durch die Einleitung dieses Artikels haben wir die Techniken zum Ändern von Spaltennamen in Pandas kennengelernt und sie anhand spezifischer Codebeispiele demonstriert. Die Beherrschung dieser Fähigkeiten kann uns helfen, Spaltennamen während des Datenanalyseprozesses flexibler zu ändern und die Effizienz der Datenverarbeitung und -analyse zu verbessern. Gleichzeitig trägt eine sinnvolle Spaltenbenennung auch zur Verbesserung der Lesbarkeit und Verständlichkeit der Daten bei und ist sehr hilfreich bei der Interpretation und visuellen Darstellung der Ergebnisse der Datenanalyse. Ich hoffe, dieser Artikel wird Ihnen bei Ihrer Datenanalyse hilfreich sein. Vielen Dank fürs Lesen! 🎜
Das obige ist der detaillierte Inhalt vonMeistern Sie den Trick, Spaltennamen in Pandas zu ändern: ein unverzichtbares Werkzeug für die Datenanalyse. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!