dalam kelas C#,
digunakan untuk pengekodan aksara dan penyahkodan. Walau bagaimanapun, ia mempunyai batasan apabila memproses watak Unicode di luar julat ASCII. Untuk mengekalkan aksara bukan -CII (seperti huruf Yunani PI (π)), kita perlu menggunakan teknologi tertentu.
Encoding
pengekodan aksara unicode
Untuk mengekod watak Unicode ke dalam rentetan ASCII kebenaran, kami menggunakan kaedah berikut:
Kaedah ini menggantikan aksara bukan -cii ke bentuk peralihan ASCII yang sepadan, seperti "π" hingga "u03a0".
static string EncodeNonAsciiCharacters(string value) { StringBuilder sb = new StringBuilder(); foreach (char c in value) { if (c > 127) { string encodedValue = "\u" + ((int)c).ToString("x4"); sb.Append(encodedValue); } else { sb.Append(c); } } return sb.ToString(); }
Untuk menyahkodkan tali ASCII yang benar kembali ke Unicode, kami menggunakan ungkapan biasa:
Ekspresi biasa ini menggantikan semua aksara Unicode Re -righteous (UXXXX) kepada watak Unicode yang sepadan, sebagai contoh, "U03A0" menjadi "π".<示> Penggunaan contoh
static string DecodeEncodedNonAsciiCharacters(string value) { return Regex.Replace(value, @"\u(?<value>[a-zA-Z0-9]{4})", m => { return ((char)int.Parse(m.Groups["Value"].Value, NumberStyles.HexNumber)).ToString(); }); }
Contoh berikut menggambarkan kod dan proses penyahkodan:
Contoh ini mengekalkan pi aksara bukan -cii semasa keseluruhan kod dan proses penyahkodan.
Atas ialah kandungan terperinci Bagaimana cara mengekod dan menyahkod aksara unicode di C#?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!