ホームページ > バックエンド開発 > C++ > Windows で UTF-8 コンテンツを Wstring にロードするにはどうすればよいですか?

Windows で UTF-8 コンテンツを Wstring にロードするにはどうすればよいですか?

Susan Sarandon
リリース: 2024-11-06 21:35:03
オリジナル
813 人が閲覧しました

How to Load UTF-8 Content into Wstrings on Windows?

Windows の Wstring への UTF-8 コンテンツのロード

Windows プラットフォームで Unicode (UTF-8) ファイルを wstring に読み取るには、慎重な処理が必要です

C 11 の出現により、std::codecvt_utf8 ファセットは、UTF-8 でエンコードされたバイト文字列を UCS2 または UCS4 文字列に変換するための堅牢なソリューションを提供します。このファセットにより、UTF-8 ファイルの読み取りと書き込みの両方が容易になります。

std::codecvt_utf8 ファセットの使用

std::codecvt_utf8 ファセットを効果的に使用するには、次の手順が必要です:

  1. カルチャ固有の情報をカプセル化し、UTF-8 変換ファセットを含むロケール オブジェクトを作成します。
  2. ローカライズされた情報を ifstream のストリーム バッファーに埋め込みます。 .
  3. 埋め込まれたストリーム バッファを使用して UTF-8 ファイルを読み取ります。

このアプローチの実装例の概要を以下に示します。

#include <sstream>
#include <fstream>
#include <codecvt>

std::wstring readFile(const char* filename) {
  std::wifstream wif(filename);
  wif.imbue(std::locale(std::locale::empty(), new std::codecvt_utf8<wchar_t>));
  std::wstringstream wss;
  wss << wif.rdbuf();
  return wss.str();
}
ログイン後にコピー

この関数UTF-8 コンテンツを wstring 変数に簡単にロードするために利用できます。

代替: グローバル C ロケールの設定

代わりに、グローバル C ロケールを設定することもできます。文字列ストリームを操作する前に、ロケールを UTF-8 に変更してください。これにより、ストリーム バッファーを手動で埋め込む必要がなくなります。

std::locale::global(std::locale(std::locale::empty(), new std::codecvt_utf8<wchar_t>));
ログイン後にコピー

このアプローチを使用すると、後続のすべての標準ロケール コンストラクターは、変更されたグローバル C ロケールのコピーを返し、UTF-8 エンコーディングの自動処理が可能になります。

以上がWindows で UTF-8 コンテンツを Wstring にロードするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート