Verstehen der Notwendigkeit des Kopierens von Datenrahmen in Pandas
Bei der Arbeit mit Pandas-Datenrahmen ist die Wahl, ob eine Kopie eines erstellt werden soll oder nicht Der Datenrahmen kann erhebliche Auswirkungen haben. Standardmäßig gibt die Indizierung eines Datenrahmens einen Verweis auf die ursprüngliche Datenstruktur zurück. Daher wirken sich alle an der Teilmenge vorgenommenen Änderungen direkt auf den übergeordneten Frame aus.
Um dieses Verhalten zu veranschaulichen, betrachten Sie das folgende Beispiel:
df = pd.DataFrame({'x': [1, 2]}) df_sub = df[0:1] df_sub.x = -1 print(df)
Ausgabe:
x 0 -1 1 2
Wie Sie beobachten können, werden durch die Änderung der Werte der Teilmenge direkt die entsprechenden Werte im ursprünglichen Datenrahmen geändert.
In Situationen, in denen es wichtig ist, den ursprünglichen Datenrahmen vor Änderungen zu schützen, ist ein Kopieren erforderlich. Dies kann mit der Methode .copy() erreicht werden. Hier ist ein Beispiel:
df_sub_copy = df[0:1].copy() df_sub_copy.x = -1 print(df)
Ausgabe:
x 0 1 1 2
In diesem Fall stellt .copy() sicher, dass alle an df_sub_copy vorgenommenen Änderungen keine Auswirkungen auf das ursprüngliche df haben.
Es ist wichtig zu verstehen, dass dieses Verhalten nur für tiefe Kopien gilt, was bedeutet, dass die gesamten referenzierten Daten in das neue Objekt kopiert werden. Im Gegensatz dazu erstellt eine flache Kopie ein neues Objekt, das auf dieselben zugrunde liegenden Daten wie das Original verweist. Daher wirken sich alle an einer flachen Kopie vorgenommenen Änderungen auch auf den ursprünglichen Datenrahmen aus.
Das obige ist der detaillierte Inhalt vonWarum wirken sich Änderungen am Pandas DataFrame manchmal auf den ursprünglichen DataFrame aus?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!