Unicode 是電腦科學中用於字元編碼的標準之一,它定義了用數字表示字元的方法。在 Unicode 中,每個字元都有一個對應的數字。這個數字被稱為 Unicode 碼點,它通常用 16 進位表示。
在 JavaScript 中,當我們需要使用 Unicode 碼點來表示一些特殊字元時,通常會將其表示為 uXXXX
的形式。其中,XXXX 是一個 4 位元的 16 進位數,表示對應字元的 Unicode 碼點。
如果我們有一串字串,而其中包含了一些特殊字符,我們可以將這些字元轉換為對應的 Unicode 碼點。 JavaScript 中提供了一些內建方法來完成這個任務。
String.charCodeAt() 方法可以傳回字串中指定位置的字元的 Unicode 碼點。例如:
let str = "hello world"; console.log(str.charCodeAt(0)); // 104,h 的 Unicode 码点是 104
我們可以使用一個循環將整個字串遍歷一遍,並將每個字元的 Unicode 碼點轉換為 uXXXX
的形式。例如:
let str = "hello world"; let unicodeStr = ""; for (let i = 0; i < str.length; i++) { // 将每一个字符的 Unicode 码点转换为 4 位的 16 进制数,然后补 0,最后拼接到结果字符串中 unicodeStr += "\u" + ("0000" + str.charCodeAt(i).toString(16)).slice(-4); } console.log(unicodeStr); // u0068u0065u006cu006cu006fu0020u0077u006fu0072u006cu0064
String.codePointAt() 方法可以傳回字串中指定位置的字元的Unicode 碼點,與String.charCodeAt() 不同的是,它可以正確處理大於16 位元的Unicode 碼點。例如:
let str = "?"; console.log(str.charCodeAt(0)); // 55362,这个码点需要使用 2 个 16 进制数表示,而 charCodeAt() 返回的是第一个 16 进制数的码点 console.log(str.codePointAt(0)); // 134071,codePointAt() 返回整个码点
使用String.codePointAt() 方法轉換字串中所有的字元為Unicode 碼點,則可以按照類似上面的方式進行遍歷:
let str = "hello ??? world"; let unicodeStr = ""; for (let i = 0; i < str.length; i++) { let codePoint = str.codePointAt(i); // 如果该字符是大于 16 位的 Unicode 码点,则需要分组转换 if (codePoint > 0xffff) { i++; // 需要跳过下一个位置 // 将码点的高 16 位和低 16 位分别转换为 4 位的 16 进制,然后拼接到结果字符串中 unicodeStr += "\u" + ("0000" + (codePoint >> 16).toString(16)).slice(-4) + "\u" + ("0000" + (codePoint & 0xffff).toString(16)).slice(-4); } else { // 将码点转换为 4 位的 16 进制数,然后补 0,最后拼接到结果字符串中 unicodeStr += "\u" + ("0000" + codePoint.toString(16)).slice(-4); } } console.log(unicodeStr); // u0068u0065u006cu006cu006fu0020ud842udfb7ud842udfb7ud842udfb7u0020u0077u006fu0072u006cu0064
上面的程式碼中,我們先判斷目前字元的碼點是否大於16 位元,如果是,則需要將其高16 位元和低16 位元分別進行轉換,然後拼接到結果字串中。如果不大於 16 位,則直接將其轉換為 4 位的 16 進制數,然後拼接到結果字串中。
總結來說,JavaScript 中可以使用String.charCodeAt() 和String.codePointAt() 方法來將字串中的字元轉換為Unicode 碼點,並使用uXXXX
# 的形式表示。如果字串中包含了大於 16 位元的 Unicode 碼點,則需要使用 String.codePointAt() 方法進行轉換,並將其高 16 位元和低 16 位元分別轉換為 4 位元的 16 進位數。
以上是javascript 字串轉 uxxxx的詳細內容。更多資訊請關注PHP中文網其他相關文章!