Erstellen eines Pandas-Datenrahmens aus einer Textdatei mit bestimmten Mustern
Sie müssen einen Pandas-Datenrahmen aus einer Textdatei mit der folgenden Struktur erstellen :
Alabama[edit] Auburn (Auburn University)[1] Florence (University of North Alabama) Jacksonville (Jacksonville State University)[2] Livingston (University of West Alabama)[2] Montevallo (University of Montevallo)[2] Troy (Troy University)[2] Tuscaloosa (University of Alabama, Stillman College, Shelton State)[3][4] Tuskegee (Tuskegee University)[5]
Die Zeilen mit „[bearbeiten]“ geben Staaten an, während die Zeilen mit „[Nummer]“ Regionen angeben. Die Aufgabe besteht darin, die Datei anhand dieser Muster aufzuteilen und den Staatsnamen für jeden Regionsnamen zu wiederholen.
Lösung:
Dieser Vorgang führt zum gewünschten Pandas DataFrame mit den Spalten „Status“ und „Regionsname“.
Beispiel:
<code class="python">import pandas as pd df = pd.read_csv("filename.txt", sep=";", names=['Region Name']) df.insert(0, 'State', df['Region Name'].str.extract('(.*)\[edit\]', expand=False).ffill()) df['Region Name'] = df['Region Name'].str.replace(r' \(.+$', '') df = df[~df['Region Name'].str.contains('\[edit\]')].reset_index(drop=True) print(df)</code>
Ausgabe:
State Region Name 0 Alabama Auburn 1 Alabama Florence 2 Alabama Jacksonville 3 Alabama Livingston 4 Alabama Montevallo 5 Alabama Troy 6 Alabama Tuscaloosa 7 Alabama Tuskegee 8 Alaska Fairbanks 9 Arizona Flagstaff 10 Arizona Tempe 11 Arizona Tucson
Das obige ist der detaillierte Inhalt vonWie erstelle ich einen Pandas-DataFrame aus einer Textdatei mit bestimmten Mustern?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!