mysql里中文佔多少個位元組?

青灯夜游
發布: 2020-10-07 13:17:18
原創
11100 人瀏覽過

在mysql中,一個中文漢字所佔的位元組數與編碼格式有關:如果是GBK編碼,則一個中文漢字佔2個位元組;如果是UTF8編碼,則一個中文漢字佔3個字節,而英文字母佔1位元組。

mysql里中文佔多少個位元組?

mysql裡中文佔多少個位元組?

1. 一個中文漢字佔多少位元組與編碼有關:

  • UTF8:一個中文漢字=3位元組

  • GBK:一個中文漢字=2個位元組

utf-8, 英文字母1位元組

2.varchar(n)能儲存幾個漢字?

varchar(n)表示n個字符,無論漢字和英文,Mysql都能存入n個字符,僅是實際字節長度有所區別

# 3.MySQL怎麼檢查長度(佔的位元組數)?

可用SQL語言中length函數: 

select LENGTH(fieldname) from tablename
登入後複製

#說明:

UTF-8:Unicode Transformation Format-8bit,允許含BOM,但通常不含BOM。是用以解國際上字元的一種多位元組編碼,它對英文使用8位元(即一個位元組),中文使用24為(三個位元組)來編碼。 UTF-8包含全世界所有國家需要用到的字符,是國際編碼,通用性強。 UTF-8編碼的文字可以在各國支援UTF8字元集的瀏覽器上顯示。如,如果是UTF8編碼,則在外國人的英文IE上也能顯示中文,他們無需下載IE的中文語言支援包。

GBK 是國家標準GB2312基礎擴容後相容GB2312的標準。 GBK的文字編碼是用雙字節來表示的,即不論中、英文字符均使用雙字節來表示,為了區分中文,將其最高位都設定成1。 GBK包含全部中文字符,是國家編碼,通用性比UTF8差,不過UTF8佔用的資料庫比GBD大。

GBK、GB2312等與UTF8之間都必須透過Unicode編碼才能互相轉換:

GBK、GB2312-->Unicode-->UTF8

UTF8- ->Unicode-->GBK、GB2312

  • GB2312是GBK的子集,GBK是GB18030的子集

  • GBK是包含中日韓字符的大字符集合

  • 為了避免所有亂碼問題,應該採用UTF-8,將來要支持國際化也非常方便

  • UTF8可以看作是大字元集,它包含了大部分文字的編碼。

  • 使用UTF8的一個好處是其他地區的使用者(如香港台灣)無需安裝簡體中文支援就能正常觀看你的文字而不會出現亂碼。

總結:

gb2312是簡體中文的碼

gbk支援簡體中文及繁體中文

big5支援繁體中文

utf8支援幾乎所有字元

#推薦教學:mysql影片教學

#

以上是mysql里中文佔多少個位元組?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

相關標籤:
來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板
關於我們 免責聲明 Sitemap
PHP中文網:公益線上PHP培訓,幫助PHP學習者快速成長!