HTML基礎教程之電腦編碼(字元集)
電腦編碼(字元集)-了解
為什麼要有字元集,是因為電腦只能處理二進位資料。為了讓電腦能辨識人類語言(0-9、a-z、A-Z、特殊符號),我們就需要對這每一個字元進行「編碼」。所謂「編碼」就是:每一個字符,可以用不同的二進位來表示。
假設:A 用二進位表示1000, B 用二進位表示1001
ASCII編碼:用1個位元組(8位元二進位)來表示所有字符,共可以表示2^8 = 256 。
ANSI編碼:其它國家,都對ASCII編碼進行擴展,用於顯示本國的語言。
ANSI在中文作業系統下,代表gb2312
#ANSI在繁體作業系統下,代表big5
ANSI在日文作業系統下,代表JIS
…
#用2個位元組(16位元二進位)(來表示,共可以表示2^16 = 65536個字元。 GB2312進行擴充,收錄了一些冷門字、罕見字、古漢語等。 共收錄2.1萬個漢字。 :計畫將世界上所有字元統一編碼,用4個位元組(32位元二進位)來表示一個字元。使用。 (多國語言編碼)
不同的字符,它會選擇合適編碼來進行翻譯。
##「國」可以使用2個位元組來表示