Guide pratique des expressions régulières Go Language : Comment faire correspondre les caractères chinois
Présentation :
L'expression régulière est un puissant outil de correspondance de modèles de texte, qui peut être utilisé pour faire correspondre et extraire des sous-chaînes qui correspondent à un certain modèle dans une chaîne. Dans le langage Go, la bibliothèque standard fournit le package regexp pour prendre en charge les opérations d'expression régulière. Cependant, en raison de la nature particulière des caractères chinois, vous pouvez rencontrer des problèmes lors de l'utilisation d'expressions régulières pour faire correspondre les caractères chinois. Cet article présentera quelques scénarios courants et fournira les solutions correspondantes et des exemples de code.
Utilisez le codage Unicode pour faire correspondre les caractères chinois :
Dans l'expression régulière de la langue Go, les caractères chinois sont mis en correspondance en utilisant la plage de codage Unicode. La plage de codage Unicode des caractères chinois est « u4E00-u9FA5 ». Voici un exemple de code qui montre comment faire correspondre les caractères chinois dans une chaîne :
package main import ( "fmt" "regexp" ) func main() { str := "你好,世界!Hello,Go语言!" re := regexp.MustCompile("[u4E00-u9FA5]+") result := re.FindAllString(str, -1) for _, v := range result { fmt.Println(v) } }
Résultats d'exécution :
你好 世界
Utilisez le codage Unicode pour exclure les caractères non chinois :
Parfois, nous pouvons avoir besoin d'exclure les caractères non chinois dans une chaîne. . Les expressions régulières fournissent l'opérateur de négation "^" pour réaliser cette fonction. Voici un exemple de code qui montre comment exclure les caractères non chinois d'une chaîne :
package main import ( "fmt" "regexp" ) func main() { str := "你好,世界!Hello,Go语言!" re := regexp.MustCompile("[^u4E00-u9FA5]+") result := re.FindAllString(str, -1) for _, v := range result { fmt.Println(v) } }
Exécuter les résultats :
, ! Hello, !
Utiliser les classes de caractères POSIX pour faire correspondre les caractères chinois :
Une autre méthode consiste à utiliser les classes de caractères POSIX pour faire correspondre les caractères chinois. Les classes de caractères POSIX se composent de deux crochets. Les crochets contiennent une ou plusieurs classes de caractères pour faire correspondre plusieurs caractères. Dans le langage Go, « range » dans la classe de caractères POSIX « [[:range:]] » peut être défini sur « [:han:] » pour correspondre aux caractères chinois. Voici un exemple de code qui montre comment utiliser les classes de caractères POSIX pour faire correspondre les caractères chinois :
package main import ( "fmt" "regexp" ) func main() { str := "你好,世界!Hello,Go语言!" re := regexp.MustCompile("[[:han:]]+") result := re.FindAllString(str, -1) for _, v := range result { fmt.Println(v) } }
Résultats d'exécution :
你好 世界
Résumé :
Cet article présente comment utiliser des expressions régulières pour faire correspondre les caractères chinois dans la langue Go. En utilisant la plage de codage Unicode, nous pouvons simplement faire correspondre et exclure les caractères chinois dans la chaîne. De plus, les classes de caractères POSIX peuvent être utilisées pour faire correspondre les caractères chinois. J'espère que cet article pourra aider les lecteurs à mieux comprendre et utiliser les expressions régulières dans la langue Go et à obtenir un traitement flexible des caractères chinois.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!