Java中char只有两个字节，总共才6万多个数值，如何表示所有的汉子？并且我测试了也可以存放日语的一个字或者韩语的

Question

char既然代表了一个字符，就应该能存放所有的字符才对呀，加上乱七八糟的各国语言字符，总不能char只能存放 中日韩的单个字符吧？

PHPz · Answer

Java utilise uniquement le codage Unicode, donc char peut stocker des caractères chinois. Qu'est-ce qu'Unicode ?
Unicode (chinois : Universal Code, International Code, Unicode, Unicode) est une norme industrielle dans le domaine de l'informatique. Il organise et code la plupart des systèmes d'écriture dans le monde, permettant aux ordinateurs de présenter et de traiter le texte de manière plus simple.

Unicode se développe avec le standard du jeu de caractères universel et est également publié sous forme de livre [1]. Unicode est encore continuellement révisé à ce jour, chaque nouvelle version ajoutant de nouveaux caractères. La dernière version est la 8.0.0 [1] sortie le 17 juin 2015, qui a reçu plus de 100 000 caractères (les 100 000 caractères ont été adoptés en 2005). Outre les glyphes visuels, les méthodes de codage et les codages de caractères standard, les données couvertes par Unicode incluent également les caractéristiques des caractères, telles que les lettres majuscules et minuscules.
Ce qui précède provient de Wikipédia unicode-Wikipedia

Il n'est pas difficile de voir de ce qui précède que les éléments Unicode ne sont pas gratuits et doivent être inclus par l'organisation Unicode. Cependant, seuls certains caractères chinois, japonais et coréens sont désormais inclus, et ils peuvent ne pas l'être. complete. Et Java utilise Unicode, donc Java prendra en charge ces caractères tant qu'ils sont inclus dans l'organisation Unicode.
Pas une très bonne réponse.

阿神 · Answer

Quand utf-8 ne suffit pas, il y a utf-16

http://baike.baidu.com/link?url=nkV9FQlo3zIu25zKLF3M1Pjp3Y6377hPnesTlnNqHb19cbkdV4P6JX9_FtCWPQ97j7BukgEZ0TBb66uqEn8rpK

黄舟 · Answer

Le caractère est stocké sur 2 octets, car 2 octets pour les caractères la ponctuation sont plus que suffisants pour représenter les caractères, mais si vous ajoutez un autre texte non anglais, chinois, etc., cela peut ne pas suffire. utilisé pour représenter un Quant aux caractères, la plage qui peut être représentée va s'étendre, et 8 octets sont théoriquement possibles
Le standard de jeu de caractères Unicode a vu le jour

Les caractères en Java utilisent le codage Unicode, 16 bits