Cara Menukar char dengan betul kepada wchar_t untuk Penyepaduan Unikod
Menukar rentetan char kepada wchar_t adalah penting untuk menyepadukan rentetan aksara biasa ke dalam aplikasi Unicode. Satu pendekatan biasa ialah melalui fungsi mbstowcs().
Percubaan asal:
Kod berikut mungkin kelihatan seperti pelaksanaan yang mudah tetapi malangnya menghasilkan hasil yang tidak dijangka:
<code class="c++">const wchar_t *GetWC(const char *c) { const size_t cSize = strlen(c)+1; wchar_t wc[cSize]; mbstowcs (wc, c, cSize); return wc; }</code>
Mengetahui Lebih Dalam:
Isunya terletak pada pengisytiharan wc sebagai pembolehubah setempat. Selepas fungsi dikembalikan, wc menjadi diuruskan, meninggalkan fungsi dengan penuding menghala ke memori sampah.
Penyelesaian:
Untuk menyelesaikan masalah ini, kami memperuntukkan memori untuk wc secara dinamik dan kembalikan penunjuk kepadanya. Kod yang diubah suai di bawah menunjukkan perkara ini:
<code class="c++">const wchar_t *GetWC(const char *c) { const size_t cSize = strlen(c)+1; wchar_t* wc = new wchar_t[cSize]; mbstowcs (wc, c, cSize); return wc; }</code>
Kaveat:
Adalah penting untuk ambil perhatian bahawa kod panggilan kini bertanggungjawab untuk mengagihkan memori yang diperuntukkan secara dinamik untuk mengelakkan ingatan bocor.
Atas ialah kandungan terperinci Mengapa Percubaan untuk Menukar char kepada wchar_t dengan mbstowcs() Membawa kepada Keputusan Yang Tidak Dijangka?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!