Identification des colonnes contenant des sous-chaînes spécifiques
Pour localiser les colonnes dont les noms contiennent une sous-chaîne spécifiée sans nécessiter une correspondance exacte, une approche itérative peut être utilisée . Cela implique d'examiner chaque nom de colonne et d'identifier ceux qui satisfont au critère de recherche.
Considérez un DataFrame avec des noms de colonnes tels que « Spike-2 », « Hey Spike » et « Spiked-in ». Pour extraire les noms de colonnes contenant la sous-chaîne 'spike', le code Python suivant peut être utilisé :
<code class="python">import pandas as pd # Initialize data data = {'spike-2': [1,2,3], 'hey spke': [4,5,6], 'spiked-in': [7,8,9], 'no': [10,11,12]} df = pd.DataFrame(data) # Iterate over column names and filter based on substring spike_cols = [col for col in df.columns if 'spike' in col] # Print resulting column names print(spike_cols)</code>
Dans ce code :
Alternativement, pour obtenir un DataFrame avec uniquement les colonnes correspondantes :
<code class="python">df2 = df.filter(regex='spike')</code>
Cela créera df2 contenant uniquement les colonnes dont les noms incluent « spike ».
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!