首先這兩個究竟是什麼關係?還有就是編碼和實作是什麼關係?有點不懂這些概念= =
首先這兩個究竟是什麼關係?還有就是編碼和實作是什麼關係?有點不懂這些概念= =
又有人問這樣的問題,我只好貼連結了。
https://segmentfault.com/q/1010000004240543/a-1020000004241029
http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html
謝謝阮一峰的部落格文章http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html
總結了一下,差別大概就是,Unicode只是一個符號集,它只規定了符號的二進位代碼,卻沒有規定這個二進位代碼應該如何儲存。 UTF-8等就是字元集的儲存方式名稱。一個是符號集,一個是儲存方式,這就是差異。
ANSI 和 unicode 是兩種不同的表示字元的標準系統。
ISO8859-1 還有GBK 這類的都是衍生自 ANSI的,這類編碼是針對某種文字而建立的標準,一般只會相容於ASCII。
UTF-8、UTF-16 這些都是unicode標準的編碼,旨在包含世界上所有的語言文字,以達到可以在不同語言環境的電腦上正常顯示文字而不亂碼,這類的編碼因為包含的字元很多,所以佔用空間會相對大一些。
簡而言之,我們常接觸到的包括UTF-8,本質都是一樣的,就是對unicode的一種包裝,因而編碼之間的轉換,需要先轉換成unicode然後再轉換。