Lecture de fichiers Unicode UTF-8 dans des chaînes Wstrings sous Windows
La lecture de fichiers Unicode (UTF-8) dans des chaînes Wstrings sous Windows peut être réalisé efficacement en utilisant la facette std::codecvt_utf8 de C 11.
Avec std::codecvt_utf8, la conversion entre les chaînes d'octets UTF-8 et les chaînes de caractères UCS2 ou UCS4 est simplifiée. Cette facette permet de lire et d'écrire des fichiers UTF-8, à la fois texte et binaires.
Pour exploiter la facette, créez un objet de paramètres régionaux qui encapsule les facettes définissant l'environnement localisé souhaité. Une fois l'objet locale créé, imprégnez-en votre tampon de flux.
Voici une implémentation utilisant l'imbuing :
#include <sstream> #include <fstream> #include <codecvt> std::wstring readFile(const char* filename) { std::wifstream wif(filename); wif.imbue(std::locale(std::locale::empty(), new std::codecvt_utf8<wchar_t>)); std::wstringstream wss; wss << wif.rdbuf(); return wss.str(); }
Après avoir imprégné le tampon de flux, la lecture du fichier dans une wstring est simple :
std::wstring wstr = readFile("a.txt");
Alternativement, définir les paramètres régionaux globaux C avant de travailler avec des flux de chaînes éliminera le besoin d'une imprégnation explicite :
std::locale::global(std::locale(std::locale::empty(), new std::codecvt_utf8<wchar_t>));
Cela définit les paramètres régionaux globaux par défaut, ce qui automatiquement s'appliquer aux futurs tampons de flux.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!