首頁 > 後端開發 > Golang > 如何從 Go 中的字串中刪除變音符號?

如何從 Go 中的字串中刪除變音符號?

Linda Hamilton
發布: 2024-12-08 11:53:14
原創
236 人瀏覽過

How Can I Remove Diacritics from Strings in Go?

在Go 中刪除變音符號

從UTF-8 編碼的字串中刪除變音符號(重音符號)是一項常見的文字處理任務。 Go 為此目的提供了多個庫,作為其文字規範化實用程式的一部分。

一種方法涉及組合多個函式庫,如下所示:

package main

import (
    "fmt"
    "unicode"

    "golang.org/x/text/transform"
    "golang.org/x/text/unicode/norm"
)

// isMn determines if a rune represents a nonspacing mark (diacritic).
func isMn(r rune) bool {
    return unicode.Is(unicode.Mn, r)
}

func main() {
    // Create a transformation chain to:
    // - Decompose the string into its unicode normalization form (NFD).
    // - Remove all nonspacing marks (diacritics).
    // - Recompose the string into its normalized form (NFC).
    t := transform.Chain(norm.NFD, transform.RemoveFunc(isMn), norm.NFC)

    // Apply the transformation to the input string "žůžo".
    result, _, _ := transform.String(t, "žůžo")

    // Print the resulting string, which is "zuzo" without diacritics.
    fmt.Println(result)
}
登入後複製

以上是如何從 Go 中的字串中刪除變音符號?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板