首頁 > 常見問題 > utf8編碼中漢字佔多少位元組

utf8編碼中漢字佔多少位元組

醉折花枝作酒筹
發布: 2023-01-13 00:36:40
原創
29030 人瀏覽過

在UTF-8編碼中,一個中文字元等於三個字節,一個中文標點符號佔三個位元組;一個英文字元等於一個字節,一個英文標點佔一個位元組;一個數字符號等於一個位元組。

utf8編碼中漢字佔多少位元組

本文操作環境:windows10系統,DELL G3電腦。

在UTF-8編碼中:一個中文等於三個字節,中文標點佔三個位元組。

一個英文字元等於一個位元組,英文標點佔一個位元組。

Unicode編碼:一個英文等於兩個字節,一個中文(含繁體)等於兩個位元組。中文標點佔兩個字節,英文標點。

擴充資料:

UTF-8使用1~4位元組為每個字元編碼:

1、一個US-ASCIl字元只需1位元組編碼(Unicode範圍由U 0000~U 007F)。

2、帶有變音符號的拉丁文、希臘文、西里爾字母、亞美尼亞語、希伯來文、阿拉伯文、敘利亞文等字母則需要2位元組編碼(Unicode範圍由U 0080~U 07FF)。

3、其他語言的字元(包括中日韓文字、東南亞文字、中東文字等)包含了大部分常用字,使用3位元組編碼。

4、其他極少使用的語言字元使用4位元組編碼。

更多電腦相關知識,請造訪常見問題欄位!

以上是utf8編碼中漢字佔多少位元組的詳細內容。更多資訊請關注PHP中文網其他相關文章!

相關標籤:
來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
最新問題
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板