java 中国語の文字は何バイトか
Java では、文字であれば可能です。 、数字であっても、英語や中国語の文字であっても、どちらも 2 バイトを占め、どちらも 1 文字です。
char c1 = '中'; char c2 = 'A'; char c3 = '1';
正確には、Unicode エンコーディングは、特定のエンコーディングではなく、エンコーディングの種類を表す一般的な用語を指します。 UTF-8 は Unicode とは異なります。
utf8 を例に挙げると、utf8 は 1 ~ 4 バイトで文字を表現できる可変長エンコーディング標準ですが、中国語は 3 バイト、ASCII 文字は 1 バイトを占めます。
Java はエンコード方式として Unicode を使用するためです。 Unicode は固定長のエンコード標準であり、各文字は 2 バイトであり、これは 1 文字型スペースに相当します。
拡張知識:
Unicode はエンコード スキームです。Unicode は、従来の文字エンコード スキームの制限を解決するために作成されました。あらゆる言語のすべての文字にユニバーサル エンコーディングを提供します。 . 言語間およびプラットフォーム間でのテキスト変換と処理の要件を満たすために、統一された一意のバイナリ エンコーディングが各文字に設定されています。 Unicode エンコードには、utf-8、utf-16、utf-32 の 3 つの具体的な実装があり、そのうち、utf-8 は 1 ~ 4 バイトを占有し、utf-16 は 2 または 4 バイトを占有し、utf-32 は 4 バイトを占有します。バイト、バイト。現在、Unicode コードは世界中の情報交換の分野で広く使用されています。
php 中国語 Web サイト、無料の Java 入門チュートリアル が多数あり、オンラインで学習することを歓迎します。
以上がJavaの漢字のバイト数は何バイトですかの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。