Hinzufügen einer neuen Spalte zu einem vorhandenen Datenrahmen
Bei der Arbeit mit Pandas-Datenrahmen ist es häufig erforderlich, neue Spalten zu vorhandenen Datenrahmen hinzuzufügen. Es gibt mehrere Ansätze, um dies zu erreichen, jeder mit seinen eigenen Vor- und Nachteilen.
1. Zuweisen verwenden (empfohlen für Pandas 0.17 und höher):
import pandas as pd import numpy as np # Generate a sample DataFrame df1 = pd.DataFrame({ 'a': [0.671399, 0.446172, 0.614758], 'b': [0.101208, -0.243316, 0.075793], 'c': [-0.181532, 0.051767, -0.451460], 'd': [0.241273, 1.577318, -0.012493] }) # Add a new column 'e' with random values sLength = len(df1['a']) df1 = df1.assign(e=pd.Series(np.random.randn(sLength)).values)
2. Mit loc[row_index, col_indexer] = value:
# Add a new column 'f' using loc df1.loc[:, 'f'] = pd.Series(np.random.randn(sLength), index=df1.index)
3. Verwenden von df[new_column_name] = pd.Series(values, index=df.index):
# Add a new column 'g' using the old method df1['g'] = pd.Series(np.random.randn(sLength), index=df1.index)
Bedenken Sie, dass die letztere Methode in neueren Versionen von Pandas möglicherweise SettingWithCopyWarning auslöst. Aus Gründen der Effizienz und Klarheit wird im Allgemeinen die Verwendung von „assign“ oder „loc“ empfohlen.
Das obige ist der detaillierte Inhalt vonWie kann ich einem Pandas-DataFrame effizient eine neue Spalte hinzufügen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!