Maison > développement back-end > Golang > Comment convertir efficacement les séquences d'échappement HTML dans Go ?

Comment convertir efficacement les séquences d'échappement HTML dans Go ?

Susan Sarandon
Libérer: 2024-12-17 15:22:16
original
647 Les gens l'ont consulté

How to Efficiently Convert HTML Escape Sequences in Go?

Conversion des caractères d'échappement dans les balises HTML

Dans Go, la conversion des balises HTML contenant des caractères d'échappement n'est pas aussi simple que souhaité. Alors que json.Marshal() peut facilement convertir des chaînes avec des caractères comme "<" à sa séquence d'échappement "u003chtmlu003e", json.Unmarshal() ne fournit pas de méthode directe et efficace pour l'opération inverse.

Utilisation de strconv.Unquote()

La fonction strconv.Unquote() peut être utilisée pour effectuer la conversion. Cependant, cela nécessite que la chaîne soit placée entre guillemets. Par conséquent, l'ajout manuel de ces caractères englobants est nécessaire.

import (
    "fmt"
    "strconv"
)

func main() {
    // Important to use backtick ` (raw string literal)
    // else the compiler will unquote it (interpreted string literal)!

    s := `\u003chtml\u003e`
    fmt.Println(s)
    s2, err := strconv.Unquote(`"` + s + `"`)
    if err != nil {
        panic(err)
    }
    fmt.Println(s2)
}
Copier après la connexion

Sortie :

\u003chtml\u003e
<html></p>
<p><strong>Remarque :</strong></p>
<p>Le package html est également disponible pour l'échappement et la déséchappement du texte HTML. Cependant, il ne décode pas les séquences Unicode de la forme uxxxx, seulement decimal; ou HH;.</p>
<pre class="brush:php;toolbar:false">import (
    "fmt"
    "html"
)

func main() {
    fmt.Println(html.UnescapeString(`\u003chtml\u003e`)) // wrong
    fmt.Println(html.UnescapeString(`&amp;#60;html&amp;#62;`))   // good
    fmt.Println(html.UnescapeString(`&amp;#x3c;html&amp;#x3e;`)) // good
}
Copier après la connexion

Sortie :

\u003chtml\u003e
<html>
<html>
Copier après la connexion

Remarque 2 :

N'oubliez pas que les chaînes entre guillemets utilisent le guillemet double ( ") sont des chaînes interprétées, qui ne sont pas mises entre guillemets par le compilateur. Pour spécifier une chaîne avec ses guillemets intacts, utilisez des guillemets pour créer une chaîne brute littéral.

s := "\u003chtml\u003e" // Interpreted string literal (unquoted by the compiler!)
fmt.Println(s)

s2 := `\u003chtml\u003e` // Raw string literal (no unquoting will take place)
fmt.Println(s2)

s3 := "\u003chtml\u003e" // Double quoted interpreted string literal
                           // (unquoted by the compiler to be "single" quoted)
fmt.Println(s3)
Copier après la connexion

Sortie :

<html>
\u003chtml\u003e
Copier après la connexion

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal