探索 MySQL 中 utf8mb4 與 utf8 字元集的差異
MySQL 提供了一系列字元集,包括 utf8mb4 和 utf8mb4 和 utf8mb。雖然兩者都基於 UTF-8 編碼,但它們的功能有所不同。
UTF-8 編碼:回顧
ASCII:支援英文字母和通用字元的7 位元編碼
支援英文字母和通用字元的7 位元編碼
UTF-8: 每個代碼點使用1-4 個位元組的可變長度編碼。
UTF-16: A 16位元編碼,主要用於作業系統。
UTF-32: 32 位元編碼,由於記憶體需求高而很少使用。
utf8mb3 和 utf8mb4
MySQL 的“utf8”編碼,也稱為“utf8mb3”,儲存每個代碼點最多三個位元組。此編碼支援「基本多語言平面」(BMP),涵蓋從 0x000 到 0xFFFF 的範圍。「utf8mb4」編碼對此進行了擴展,支援每個代碼點四個位元組。此擴充功能可以儲存 BMP 以外的“補充字元”,包括表情符號和某些亞洲字元。
隨著技術的發展和新 Unicode 字元的引入,utf8mb4 確保您的資料庫可以容納它們。
總之,如果您需要 BMP 以外的角色支援或計劃讓您的資料庫面向未來,「utf8mb4」是最佳選擇。以上是MySQL 中的 UTF8mb4 與 utf8:您應該選擇哪種字元集?的詳細內容。更多資訊請關注PHP中文網其他相關文章!