> 백엔드 개발 > C++ > Windows에서 UTF-8 파일을 wstring으로 효율적으로 읽는 방법은 무엇입니까?

Windows에서 UTF-8 파일을 wstring으로 효율적으로 읽는 방법은 무엇입니까?

Mary-Kate Olsen
풀어 주다: 2024-11-05 22:09:02
원래의
261명이 탐색했습니다.

How to efficiently read a UTF-8 file into a wstring on Windows?

Windows에서 wstring을 통해 유니코드 데이터에 액세스

Windows에서 유니코드 텍스트를 처리할 때 유니코드(UTF)를 효율적으로 읽는 방법에 대한 의문이 생깁니다. -8) 파일을 wstring(s)으로 변환합니다. 다행스럽게도 C 11은 std::codecvt_utf8 패싯을 통해 다양한 솔루션을 제공합니다.

codecvt_utf8 패싯은 UTF-8 바이트 문자열과 UCS2 또는 UCS4 문자열 사이의 브리지 역할을 하여 두 텍스트에 대한 읽기 및 쓰기 작업을 가능하게 합니다. 및 바이너리 UTF-8 파일. 이 패싯을 활용하려면 필요한 UTF-8 패싯을 캡슐화하는 로캘 개체를 만드는 것이 좋습니다. 그런 다음 이 로케일 객체를 사용하여 스트림 버퍼를 주입함으로써 UTF-8 파일을 효율적으로 처리할 수 있습니다.

다음 코드 조각은 이 기술을 사용하여 UTF-8 파일을 wstring으로 읽는 방법을 보여줍니다.

<code class="cpp">#include <sstream>
#include <fstream>
#include <codecvt>

std::wstring readFile(const char* filename) {
    std::wifstream wif(filename);
    wif.imbue(std::locale(std::locale::empty(), new std::codecvt_utf8<wchar_t>));
    std::wstringstream wss;
    wss << wif.rdbuf();
    return wss.str();
}</code>
로그인 후 복사

이 함수를 사용하려면 파일 이름을 인수로 전달하고 반환된 wstring을 변수에 할당하면 됩니다.

<code class="cpp">std::wstring wstr = readFile("a.txt");</code>
로그인 후 복사

또는 전역 C 로캘을 UTF-8로 설정할 수도 있습니다. 문자열 스트림으로 작업하기 전에 codecvt_utf8 패싯을 사용하세요. 이렇게 하면 std::locale 기본 생성자에 대한 호출이 원하는 코덱이 포함된 전역 C 로케일을 반환하게 됩니다.

<code class="cpp">std::locale::global(std::locale(std::locale::empty(), new std::codecvt_utf8<wchar_t>));</code>
로그인 후 복사

이 전역 설정을 사용하면 스트림 버퍼에 로케일을 명시적으로 포함할 필요가 없습니다. C 코드에서 UTF-8 파일 처리 프로세스를 단순화합니다.

위 내용은 Windows에서 UTF-8 파일을 wstring으로 효율적으로 읽는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿