1. getBytes は Java 文字列処理の標準関数で、文字列で表される文字を charset に従ってエンコードし、バイト形式で表現する機能があります。
注: 文字列は常に Unicode エンコードで Java メモリに保存されます。
2. newString は、charset エンコーディングに従ってバイト配列を結合して識別し、それを Unicode ストレージに変換します。
3. setCharacterEncoding()
この関数は、http リクエストまたは対応するエンコーディングを設定するために使用されます。
例
package com.test.bs; import java.io.UnsupportedEncodingException; public class UnicodeTest2 { public static void main(String[] args) { String a = "哈哈"; try { byte[] gb2312 = a.getBytes("GB2312"); byte[] utf = a.getBytes("UTF-8"); for (int i = 0; i < gb2312.length; i++) { System.out.print(gb2312[i]); } System.out.println(); for (int i = 0; i < utf.length; i++) { System.out.print(utf[i]); } System.out.println(); System.out.println(new String(gb2312)); System.out.println(new String(utf)); System.out.println(System.getProperty("file.encoding"));//当前文件的编码方式 System.out.println(new String(utf, "UTF-8")); System.out.println(new String(gb2312, "UTF-8")); } catch (UnsupportedEncodingException e) { e.printStackTrace(); } } }
以上がJavaで文字を処理する関数とは何ですかの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。