Java 的字符串内部表示形式是什么:修改后的 UTF-8 或 UTF-16?
Java 使用 UTF-16 作为其内部文本表示,如 Oracle 文档所述。这种表示形式适用于 Java 平台内存储字符序列的各种数据结构和类,例如 String 和 StringBuilder。 Java 中的 16 位无符号整数 (char) 可以表示 UTF-16 的 Unicode 代码点或代码单元。
但是,Java 还采用 UTF-8 的非标准修改来进行字符串序列化。这意味着序列化的字符串默认以 UTF-8 格式存储。
为了在内存中存储,Java 对 char 数据类型使用 2 个字节。请注意,代码点可能需要一个或两个 char 实例,从而分别产生 2 或 4 个字节的存储空间。
以上是Java 内部如何表示字符串:UTF-8 或 UTF-16?的详细内容。更多信息请关注PHP中文网其他相关文章!