java 漢字幾個位元組
java中,只要是字符,不管是數字還是英文還是漢字,都佔2個字節,都是一個char。
char c1 = '中'; char c2 = 'A'; char c3 = '1';
確切地說,Unicode編碼是指一類編碼的統稱,而非某個特定編碼。 utf-8跟unicode是不一樣的。
以utf8為例,utf8是變長編碼標準,可以以1~4個位元組表示一個字符,而中文佔3個位元組,ascII字符佔1個位元組。
因為java是以unicode作為編碼方式的。 unicode是一個定長的編碼標準,每個字元都是2個位元組,也就是1個char類型的空間。
擴充知識:
Unicode是編碼方案,Unicode 是為了解決傳統的字元編碼方案的限製而產生的,它為每種語言中的每個字元設定了統一且唯一的二進位編碼,以滿足跨語言、跨平台進行文字轉換、處理的要求。 Unicode 編碼共有三種具體實現,分別為utf-8,utf-16,utf-32,其中utf-8佔用一到四個字節,utf-16佔用二或四個字節,utf-32佔用四個位元組。目前Unicode 碼在全球範圍的資訊交換領域有廣泛的應用。
php中文網,大量的免費Java入門教學,歡迎線上學習!
以上是java 漢字幾個位元組的詳細內容。更多資訊請關注PHP中文網其他相關文章!