Go での非 UTF-8 テキスト ファイルの読み取り
問題:
標準の Go ライブラリはすべてのテキスト ファイルに対して UTF-8 エンコードを前提としているため、他の形式でエンコードされたファイルを読み取る必要が生じます。 GBK などの形式。これはどのように実現できますか?
解決策:
cgo を必要とし、外部ライブラリをラップするサードパーティ パッケージを使用する代わりに、Go はそのサブシステムを通じてネイティブ ソリューションを提供します。リポジトリ。 golang.org/x/text/encoding パッケージは、汎用文字エンコーディングのインターフェイスを提供します。
具体的には、golang.org/x/text/encoding/simplifiedchinese サブパッケージは、GB18030、GBK、およびHZ-GB2312 エンコーディング。これらのエンコーディングを使用すると、開発者は GBK でエンコードされたファイルをシームレスに読み書きできます。
このプロセスを示す例には、読み取りまたは読み取り中にオンザフライでエンコードとデコードを実行する io.Reader と io.Writer の作成が含まれます。データの書き込み中。これにより、非 UTF-8 ファイルの効率的かつ透過的な処理が可能になります。
以上がGo で非 UTF-8 エンコード (GBK など) ファイルを読み取るにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。