Élimination des caractères indésirables des chaînes dans les colonnes DataFrame
Lorsque vous traitez des ensembles de données contenant des données de chaîne, il est souvent nécessaire d'en extraire des informations significatives. cordes. Cependant, des caractères ou un formatage indésirables peuvent masquer les données souhaitées. Dans ce scénario, l'objectif est de supprimer efficacement ces parties indésirables.
Supposons que nous ayons une colonne DataFrame avec les données suivantes :
time | result |
---|---|
09:00 | 52A |
10:00 | 62B |
11:00 | 44a |
12:00 | 30b |
13:00 | -110a |
Notre objectif est de couper les données pour supprimer les ' ' ou le préfixe '-' et le suffixe 'a' ou 'b'. Le résultat souhaité est :
time | result |
---|---|
09:00 | 52 |
10:00 | 62 |
11:00 | 44 |
12:00 | 30 |
13:00 | 110 |
Pour y parvenir, nous utilisons la fonction lambda dans la méthode map. L'extrait de code suivant accomplit la tâche :
data['result'] = data['result'].map(lambda x: x.lstrip('+-').rstrip('aAbBcC'))
La fonction lstrip supprime tous les caractères de début ' ' ou '-', tandis que la fonction rstrip supprime tous les caractères de fin 'a', 'A', 'b', Caractères « B » ou « c ». La sortie est un DataFrame avec les données découpées souhaitées.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!