Suppression des séquences d'échappement ANSI dans les chaînes Python
De nombreux outils de ligne de commande et applications SSH ajoutent des séquences d'échappement ANSI à leurs sorties pour contrôler le comportement des terminaux et améliorer la présentation visuelle. Cependant, ces séquences peuvent s'avérer fastidieuses lorsque vous souhaitez analyser ou traiter le contenu de la chaîne sans repères visuels. Cet article explore une approche pythonique pour supprimer de telles séquences d'échappement et extraire le contenu en texte brut.
Problème :
Considérez l'exemple de chaîne suivant extrait d'une commande SSH :
'ls\r\n\x1b[00m\x1b[01;31mexamplefile.zip\x1b[00m\r\n\x1b[01;31m'
L'objectif est de supprimer par programme les séquences d'échappement ANSI, ne laissant que le texte en clair contenu :
'examplefile.zip'
Solution :
Le module d'expression régulière de Python fournit une solution succincte à ce problème. L'expression régulière suivante capture et supprime efficacement toutes les séquences d'échappement ANSI :
import re ansi_escape = re.compile(r''' \x1B # ESC (?: # 7-bit C1 Fe (except CSI) [@-Z\-_] | # or [ for CSI, followed by a control sequence \[ [0-?]* # Parameter bytes [ -/]* # Intermediate bytes [@-~] # Final byte ) ''', re.VERBOSE)
Pour appliquer l'expression régulière et extraire le texte souhaité :
import re ansi_escape = re.compile(r'\x1B(?:[@-Z\-_]|\[[0-?]*[ -/]*[@-~])') sometext = 'ls\r\n\x1b[00m\x1b[01;31mexamplefile.zip\x1b[00m\r\n\x1b[01;31m' result = ansi_escape.sub('', sometext)
Sortie :
'ls\r\nexamplefile.zip\r\n'
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!