Java는 유니코드 인코딩을 사용합니다. char 유형 변수의 범위는 0~65535입니다. 부호 없는 값은 기본적으로 지구상의 모든 문자를 포함할 수 있습니다. 한자인지, 아니면 문자열의 문자에 비즈니스 요구 사항을 충족하는 한자가 있는지 여부입니다. 아래 예를 참조하세요.
String s1 = "我是中国人"; String s2 = "imchinese"; String s3 = "im中国人"; System.out.println(s1+":"+new String(s1).length()); System.out.println(s2+":"+new String(s2).length()); System.out.println(s3+":"+new String(s3).length());
OUTPUT:
I. 중국어인지 여부: 5
imchinese: 9
im 중국어: 5
java는 문자열이 중국어인지 여부를 결정합니다.
/** * 判断该字符串是否为中文 * @param string * @return */ public static boolean isChinese(String string){ int n = 0; for(int i = 0; i < string.length(); i++) { n = (int)string.charAt(i); if(!(19968 <= n && n <40869)) { return false; } } return true; }
유니코드 인코딩 범위:
한자: [0x4e00,0x9fa5](또는 십진수 [19968, 40869) ])
숫자: [0x30, 0x39] (또는 십진수 [48, 57])
소문자: [0x61, 0x7a] (또는 십진수 [97, 122])
대문자: [0x41, 0x5a ] (또는 십진수 [65, 90])
유니코드 중국어 범위
한자 인코딩 범위: u4e00-u9FA5
2바이트 문자 인코딩 범위: u0391-uFFE5
더 많은 Java 지식을 보려면 java에 주목하세요. 기본 튜토리얼.
위 내용은 Java에서 문자열이 중국어인지 확인의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!