注意HTML的語言編碼的重要性
#一、編碼重要性 -
TOP
TOP
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
透過改變charset=utf-8中的utf-8就可以改變網頁的編碼。
一般我們在寫CSS檔案時候也需要在CSS檔案頂部使用五、UTF-8 有一下特性: -
TOPUTF-8 編碼字元理論上可以最多到6 個位元組長, 然而16 位元BMP 字元最多只用到3 位元組長.
Bigendian UCS-4 位元組字串的排列順序是預定的.
位元組0xFE 和0xFF 在UTF-8 編碼中從未用到.
六、GB2312 有以下特性 -
TOPGB2312標準共收錄6763個漢字,其中一級漢字3755個,二級漢字3008個;同時,GB2312收錄了包括拉丁字母、希臘字母、日文平假名及片假名字母、俄羅斯語西里爾字母在內的682個全形字元。
16-55區為一級漢字,依拼音排序。 56-87區為二級漢字,依部首/筆畫排序。
###10-15區及88-94區則未有編碼。 ######舉例來說,「啊」字是GB2312之中的第一個漢字,它的區碼就是1601。位元組結構在使用GB2312的程式中,通常採用EUC儲存方法,以便 相容於ASCII。每個漢字及符號以兩個位元組來表示。第一個位元組稱為“高位元組”,第二個位元組稱為“低位元組”。 「高位元組」使用了0xA1-0xF7(把01-87區的區號加上0xA0),「低位元組」使用了0xA1-0xFE(把01-94加上0xA0)。例如 「啊」字在大多數程式中,會以0xB0A1儲存。 (與區位碼比較:0xB0=0xA0+16,0xA1=0xA0+1)。 ######所以GB2312編碼中漢字區碼的十進位是從176到247,位碼是從161到255.之所以儲存了6763小於82*94=6768,是因為在區碼為215,位碼為250-254之間共五個編碼沒有漢字編碼,所以6768-5=6763個。 #########GB2312編碼可以通俗地理解為國內通用的語言。 #########七、推薦charset使用編碼 - ###TOP############UTF-8可以通俗理解簡體繁體可用此編碼如台灣和內地使用此編碼。 #######如果編碼混排將使網頁亂碼也叫不相容,特別是在CSS註釋中使用了編碼混排將導致css hack。
希望以後在製作網頁的時候千萬不要忘記網頁編碼的聲明。
瀏覽過此頁使用者也瀏覽以下內容:
1、UTF-8 GBK UTF8 GB2312之間的差異與關係
2、html編碼如何選擇
3、html編碼設置
以上是html中關於charset的語言編碼詳解的詳細內容。更多資訊請關注PHP中文網其他相關文章!