Diviser le texte séparé par des virgules à l'exclusion des guillemets
Lors du traitement d'un texte séparé par des virgules avec des guillemets intégrés, il devient nécessaire d'ignorer les virgules dans les guillemets. sections. Ce problème survient lors de l'utilisation de la méthode string.split(",") par défaut en Python.
Considérez la chaîne suivante :
"123,test,444,\"don't split, this\",more test,1"
Le fractionnement de cette chaîne à l'aide de la méthode par défaut donnerait ce qui suit résultat :
["123", "test", "444", "\"don't split", " this\"", "more test", "1"]
Comme vous pouvez le constater, la virgule à l'intérieur de la section citée n'est pas ignorée. Pour résoudre ce problème, une expression régulière est requise.
str.split(",(?=(?:[^\"]*\"[^\"]*\")*[^\"]*$)")
Explication de l'expression régulière :
Cette expression régulière garantit que seules les virgules en dehors des sections citées sont reconnus comme séparateurs.
Alternativement, l'utilisation du modificateur (?x) dans Python vous permet de décomposer l'expression régulière en plusieurs lignes pour une meilleure lisibilité :
str.split("(?x)\n\ , \n\ (?=\n\ (?: \n\ [^\"]* \n\ \" \n\ [^\"]* \n\ \" \n\ )* \n\ [^\"]* \n\ $ \n\ ) \n")
Ce code divise efficacement la chaîne d'entrée dans une liste où chaque élément représente une sous-chaîne séparée par une virgule en dehors de toute section citée.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!