Lecture de fichiers Unicode UTF-8 dans WStrings
Dans les environnements Windows, l'utilisation de C 11 offre la possibilité de lire Unicode (UTF-8) fichiers dans wstrings. Ceci est rendu possible grâce à l'utilisation de la facette std::codecvt_utf8.
facette std::codecvt_utf8
La facette std::codecvt_utf8 facilite la conversion entre UTF- 8 chaînes d'octets codées et des chaînes de caractères UCS2 ou UCS4. Cette polyvalence permet la lecture et l'écriture de fichiers texte et binaires UTF-8.
Utilisation
Une implémentation utilisant la facette implique la création d'un objet local qui encapsule la facette. et des informations spécifiques aux paramètres régionaux. En imprégnant un tampon de flux avec ces paramètres régionaux, la lecture de fichiers UTF-8 devient possible.
Un exemple d'implémentation utilisant cette approche est :
#include <sstream> #include <fstream> #include <codecvt> std::wstring readFile(const char* filename) { std::wifstream wif(filename); wif.imbue(std::locale(std::locale::empty(), new std::codecvt_utf8<wchar_t>)); std::wstringstream wss; wss << wif.rdbuf(); return wss.str(); } int main() { std::wstring wstr = readFile("a.txt"); // Do something with your wstring return 0; }
Paramètre global des paramètres régionaux
Alternativement, il est possible de définir la locale C globale avec la facette std::codecvt_utf8. Cette méthode garantit que tous les constructeurs par défaut std::locale renverront une copie des paramètres régionaux globaux, éliminant ainsi le besoin d'imprégnation explicite du tampon de flux.
Pour définir les paramètres régionaux globaux :
std::locale::global(std::locale(std::locale::empty(), new std::codecvt_utf8<wchar_t>));
Avec ce paramètre, vous pouvez simplifier l'opération de lecture du fichier pour :
std::wifstream wif("a.txt"); std::wstringstream wss; wss << wif.rdbuf(); std::wstring wstr = wss.str();
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!