Unicode 字串轉換方法
在各種程式設計場景中,可能需要在不同類型的 Unicode 字串之間進行轉換。然而,現有的使用 mbstowcs() 和 wcstombs() 的方法有其限制。雖然這些方法在多位元組字元集和寬字串之間執行轉換,但它們不一定適用於 UTF-16 或 UTF-32,並且它們取決於語言環境的 wchar_t 編碼。
C 中的更好方法11
C 11 引入了幾個用於Unicode 字串轉換的新選項,包括:
1。 std::wstring_convert
這個範本類別提供了一個方便的介面來在字串之間進行轉換。它可以與不同的 codecvt 方面一起使用來處理各種轉換,例如 UTF-8 到 UTF-16 或 UTF-8 到 UTF-32:
<code class="cpp">std::wstring_convert<std::codecvt_utf8_utf16<char16_t>, char16_t> convert; std::string utf8_string = u8"This string has UTF-8 content"; std::u16string utf16_string = convert.from_bytes(utf8_string);</code>
2。新的Codecvt 專業化
C 11 還引入了更易於使用的新的codecvt 專業化:
<code class="cpp">std::codecvt_utf8_utf16<char16_t> // converts between UTF-8 and UTF-16 std::codecvt_utf8<char32_t> // converts between UTF-8 and UTF-32 std::codecvt_utf8<char16_t> // converts between UTF-8 and UCS-2</code>
這些專業化可以與std::wstring_convert 一起使用以促進轉換:
<code class="cpp">std::wstring_convert<std::codecvt_utf8_utf16<char16_t>, char16_t> convert16; std::string a = convert16.to_bytes(u"This string has UTF-16 content");</code>
注意:由於typedef 類型的模板專業化限制,Visual Studio 2010 在使用這些專業化時可能會出現問題。在這種情況下,建議使用析構函數定義 codecvt 的子類別或使用 std::use_facet 模板函數。
3.在UTF-32 和UTF-16 之間轉換
由於C 11 不提供UTF-32 和UTF-16 之間的直接轉換,您可以組合std::wstring_convert:
的兩個實例<code class="cpp">std::wstring_convert<std::codecvt_utf8_utf32<char32_t>, char32_t> convert32; std::wstring_convert<std::codecvt_utf8_utf16<char16_t>, char16_t> convert16; std::u32string utf32_string = u"This string has UTF-32 content"; std::string utf8_string = convert32.to_bytes(utf32_string); std::u16string utf16_string = convert16.from_bytes(utf8_string);</code>
以上是如何在 C 11 中不同類型的 Unicode 字串之間進行轉換?的詳細內容。更多資訊請關注PHP中文網其他相關文章!