Heim > Backend-Entwicklung > Python-Tutorial > Wie extrahiere ich Spalten mit passenden Teilzeichenfolgen in Pandas DataFrame iterativ und unter Verwendung regulärer Ausdrücke?

Wie extrahiere ich Spalten mit passenden Teilzeichenfolgen in Pandas DataFrame iterativ und unter Verwendung regulärer Ausdrücke?

Susan Sarandon
Freigeben: 2024-10-20 13:58:29
Original
601 Leute haben es durchsucht

How to Extract Columns with Matching Substrings in pandas DataFrame Iteratively and Using Regular Expressions?

Identifizieren von Spalten, die bestimmte Teilzeichenfolgen enthalten

Um Spalten zu finden, deren Namen eine bestimmte Teilzeichenfolge enthalten, ohne dass eine genaue Übereinstimmung erforderlich ist, kann ein iterativer Ansatz verwendet werden . Dazu gehört die Untersuchung jedes Spaltennamens und die Identifizierung derjenigen, die das Suchkriterium erfüllen.

Stellen Sie sich einen DataFrame mit Spaltennamen wie „Spike-2“, „Hey Spike“ und „Spiked-In“ vor. Um die Spaltennamen zu extrahieren, die die Teilzeichenfolge „Spike“ enthalten, kann der folgende Python-Code verwendet werden:

<code class="python">import pandas as pd

# Initialize data
data = {'spike-2': [1,2,3], 'hey spke': [4,5,6], 'spiked-in': [7,8,9], 'no': [10,11,12]}
df = pd.DataFrame(data)

# Iterate over column names and filter based on substring
spike_cols = [col for col in df.columns if 'spike' in col]

# Print resulting column names
print(spike_cols)</code>
Nach dem Login kopieren

In diesem Code:

  1. df.columns gibt eine Liste von Spalten zurück Namen.
  2. Das Listenverständnis [col for col in df.columns if 'spike' in col] iteriert über jeden Spaltennamen unter Verwendung der Variablen col und erstellt eine neue Liste, die nur Namen enthält, die die Teilzeichenfolge 'spike' enthalten. .
  3. Die resultierenden Spike_cols enthalten die gewünschten Spaltennamen, auf die später mit df['col_name'] oder df[col_name] zugegriffen werden kann.

Alternativ können Sie einen DataFrame mit erhalten nur die passenden Spalten:

<code class="python">df2 = df.filter(regex='spike')</code>
Nach dem Login kopieren

Dadurch wird df2 erstellt, das nur die Spalten enthält, deren Namen „Spike“ enthalten.

Das obige ist der detaillierte Inhalt vonWie extrahiere ich Spalten mit passenden Teilzeichenfolgen in Pandas DataFrame iterativ und unter Verwendung regulärer Ausdrücke?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage