ホームページ > バックエンド開発 > Golang > Go で非 UTF-8 テキスト (Windows-1256 など) を UTF-8 に変換するにはどうすればよいですか?

Go で非 UTF-8 テキスト (Windows-1256 など) を UTF-8 に変換するにはどうすればよいですか?

Susan Sarandon
リリース: 2024-12-08 00:35:10
オリジナル
458 人が閲覧しました

How Can I Convert Non-UTF-8 Text (e.g., Windows-1256) to UTF-8 in Go?

Go でのエンコーディング変換: テキストを非 UTF-8 から UTF-8 に変換する

あるエンコーディングから別のエンコーディングへのテキストの変換Windows-1256 アラビア語から UTF-8 への変換など、ソフトウェア開発では一般的なタスクです。 Go では、これはエンコード パッケージを使用して実現できます。

エンコード パッケージは、Windows-1256 を含む幅広いエンコードのサポートを提供します。テキストを Windows-1256 から UTF-8 に変換するには、Windows-1256 エンコード オプションを提供する Charmap パッケージを使用できます。

プロセスを示す例は次のとおりです。

package main

import (
    "bytes"
    "fmt"
    "golang.org/x/text/encoding/charmap"
    "golang.org/x/text/transform"
)

func main() {
    // Declare a Windows-1256 decoder that will read from our input string.
    decoder := transform.NewReader(strings.NewReader("This is a Windows-1256 string."), charmap.Windows1256.NewDecoder())

    // Convert the string to UTF-8 by writing to a bytes buffer.
    var b bytes.Buffer
    if _, err := b.ReadFrom(decoder); err != nil {
        fmt.Println(err)
        return
    }

    fmt.Println(b.String())
}
ログイン後にコピー

この例では、transform.NewReader 関数を使用して、Windows-1256 でエンコードされた文字列を読み取るデコーダーを作成します。次に、このデコーダを使用して文字列が UTF-8 に変換され、UTF-8 でエンコードされた出力文字列がコンソールに出力されます。

以上がGo で非 UTF-8 テキスト (Windows-1256 など) を UTF-8 に変換するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート