Java에서 문자열 바이트 계산
Java에서 문자열은 가변 바이트 수를 포함할 수 있는 문자 모음입니다. 문자열이 차지하는 바이트 수는 문자열을 인코딩하는 데 사용된 문자 집합에 따라 다릅니다.
인코딩된 바이트 수 가져오기
문자열의 바이트 수를 확인하려면, getBytes() 메서드를 사용하여 바이트 배열로 변환할 수 있습니다. 이 메소드는 인코딩 형식을 인수로 사용하고 인코딩된 문자열로 채워진 바이트 배열을 반환합니다. 배열의 길이는 인코딩된 문자열의 바이트 수를 나타냅니다.
예:
<code class="java">String string = "Hello World"; // Get UTF-8 encoded byte count byte[] utf8Bytes = string.getBytes("UTF-8"); System.out.println(utf8Bytes.length); // prints 11 // Get UTF-16 encoded byte count byte[] utf16Bytes = string.getBytes("UTF-16"); System.out.println(utf16Bytes.length); // prints 24 // Get UTF-32 encoded byte count byte[] utf32Bytes = string.getBytes("UTF-32"); System.out.println(utf32Bytes.length); // prints 44</code>
인코딩 변형
예제에서 볼 수 있듯이 "Hello World"와 같은 ASCII 문자열도 사용된 인코딩에 따라 바이트 수가 다를 수 있습니다.
문자 세트
중요합니다. 문자열을 인코딩할 때 적절한 문자 집합을 선택합니다. 문자 집합마다 문자를 바이트로 표시하는 방법이 다르므로 바이트 수가 다양해집니다.
기본 문자 집합
문자 집합을 지정하지 않으면 Java 플랫폼의 기본 문자 집합을 사용합니다. 그러나 일관된 결과를 보장하려면 기본값에 의존하지 말고 문자 집합을 명시적으로 지정하는 것이 좋습니다.
위 내용은 Java 문자열은 몇 바이트를 차지합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!