Nettoyer efficacement les chaînes de colonnes DataFrame
Supprimer les parties indésirables des chaînes d'une colonne DataFrame est une tâche courante dans le nettoyage des données. Cela peut nécessiter la suppression de caractères, préfixes ou suffixes spécifiques.
Considérez un DataFrame avec la structure de données suivante :
Time | Result |
---|---|
09:00 | 52A |
10:00 | 62B |
11:00 | 44a |
12:00 | 30b |
13:00 | -110a |
Notre objectif est d'extraire la partie numérique de chaque résultat. ', en supprimant les signes ' ' et '-' ainsi que les caractères de fin. Le résultat souhaité devrait ressembler à ceci :
Time | Result |
---|---|
09:00 | 52 |
10:00 | 62 |
11:00 | 44 |
12:00 | 30 |
13:00 | 110 |
Pour y parvenir, nous pouvons utiliser la fonction lambda de Python. Le code suivant nettoie efficacement les données de la colonne « Résultat » :
data['Result'] = data['Result'].map(lambda x: x.lstrip('+-').rstrip('aAbBcC'))
Cette fonction lambda parcourt chaque élément de la colonne « Résultat » :
En appliquant ces opérations, nous obtenons le résultat souhaité, avec les parties indésirables supprimées des chaînes dans la colonne 'Résultat'.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!