Rätsel: Erstellen einer leeren Datenstruktur
Sie möchten einen DataFrame erstellen und ihn anschließend mit Zeitreihendaten füllen. Zunächst stellen Sie sich einen leeren DataFrame vor, der mit bestimmten Spalten und Zeitstempeln ausgestattet ist, die alle mit Nullen oder NaN-Werten versehen sind.
Aktueller Ansatz: Eine unelegante Lösung
Ihr aktueller Code wird initialisiert einen DataFrame mit Nur-Null-Spalten und Zeitstempelzeilen, bevor er die Daten durchläuft, um neue Werte zu berechnen. Obwohl dieser Ansatz seinen Zweck erfüllt, fühlt er sich umständlich an und lässt auf die Existenz einer effizienteren Lösung schließen.
Bevorzugte Lösung: Sammeln von Daten in einer Liste
Zur Optimierung dieses Prozesses ist es ratsam, ein zeilenweises Wachstum im DataFrame zu vermeiden. Sammeln Sie stattdessen Daten in einer Liste und initialisieren Sie dann einen DataFrame, sobald die Datenerfassung abgeschlossen ist. Listen sind leichter, verbrauchen weniger Speicher und erleichtern die automatische Inferenz und Indexzuweisung von D-Typen.
data = [] for row in some_function_that_yields_data(): data.append(row) df = pd.DataFrame(data)
Vorteile der Akkumulation in einer Liste
Zu vermeidende veraltete Methoden
Bestimmte Praktiken, die bei unerfahrenen Benutzern weit verbreitet sind, sollten aufgrund ihrer Ineffizienz vermieden werden Nuancen:
Das obige ist der detaillierte Inhalt vonWie kann ich effizient einen leeren Datenrahmen für Zeitreihendaten erstellen, bevor ich ihn fülle?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!