Pandas bietet umfassende Tools zur Datenbearbeitung, einschließlich der Möglichkeit, eine Zelle zu teilen, die mehrere durch Kommas getrennte Werte enthält in mehrere Reihen aufteilen. In diesem Leitfaden werden wir Methoden untersuchen, um dies zu erreichen, indem wir zwei verschiedene Ansätze verwenden, die auf der Pandas-Version basieren.
Für Pandas-Versionen 0,25 und höher können Sie eine Kombination verwenden von apply, str.split und Series.explode, um das gewünschte Ergebnis zu erzielen. Hier ist der Codeausschnitt:
<code class="python">(df.set_index(['order_id', 'order_date']) .apply(lambda x: x.str.split(',').explode()) .reset_index()) </code>
Erklärung:
Für Pandas-Versionen 0.24 und niedriger ist ein komplexerer Ansatz mit Stack, Unstack und Str.Split erforderlich:
<code class="python">(df.set_index(['order_date', 'order_id']) .stack() .str.split(',', expand=True) .stack() .unstack(-2) .reset_index(-1, drop=True) .reset_index() )</code>
Erklärung:
Beide Methoden geben einen neuen DataFrame mit den aufgelösten Werten als separate Zeilen zurück, wie in dargestellt die gewünschte Ausgabe, die Sie bereitgestellt haben.
Das obige ist der detaillierte Inhalt vonWie kann ich eine durch Kommas getrennte Zelle in einem Pandas DataFrame in mehrere Zeilen aufteilen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!