Identifizieren von Spalten, die bestimmte Teilzeichenfolgen enthalten
Um Spalten zu finden, deren Namen eine bestimmte Teilzeichenfolge enthalten, ohne dass eine genaue Übereinstimmung erforderlich ist, kann ein iterativer Ansatz verwendet werden . Dazu gehört die Untersuchung jedes Spaltennamens und die Identifizierung derjenigen, die das Suchkriterium erfüllen.
Stellen Sie sich einen DataFrame mit Spaltennamen wie „Spike-2“, „Hey Spike“ und „Spiked-In“ vor. Um die Spaltennamen zu extrahieren, die die Teilzeichenfolge „Spike“ enthalten, kann der folgende Python-Code verwendet werden:
<code class="python">import pandas as pd # Initialize data data = {'spike-2': [1,2,3], 'hey spke': [4,5,6], 'spiked-in': [7,8,9], 'no': [10,11,12]} df = pd.DataFrame(data) # Iterate over column names and filter based on substring spike_cols = [col for col in df.columns if 'spike' in col] # Print resulting column names print(spike_cols)</code>
In diesem Code:
Alternativ können Sie einen DataFrame mit erhalten nur die passenden Spalten:
<code class="python">df2 = df.filter(regex='spike')</code>
Dadurch wird df2 erstellt, das nur die Spalten enthält, deren Namen „Spike“ enthalten.
Das obige ist der detaillierte Inhalt vonWie extrahiere ich Spalten mit passenden Teilzeichenfolgen in Pandas DataFrame iterativ und unter Verwendung regulärer Ausdrücke?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!