한자의 내부 코드를 저장하려면 2바이트가 필요합니다. 중국의 대중적인 한자 체계에서는 한자의 내부 코드가 2바이트를 차지한다. 한자 처리 체계는 한자와 서양어 간의 호환성을 보장해야 하기 때문에 ASCII 코드와 한자 국가 표준 코드가 존재할 경우 모호성이 발생한다. 이를 위해서는 한자 내부코드를 적절하게 가공하여 국가표준코드로 변환해야 한다.
이 기사의 운영 환경: windows10 시스템, thinkpad t480 컴퓨터.
한자의 내부 코드를 저장하려면 몇 바이트가 필요합니까?
한자의 내부 코드를 저장하려면 2바이트가 필요합니다.
우리나라 국가표준국은 1981년 5월에 "정보 교환을 위한 한자 코드 문자 집합 - 기본 집합"을 공포했습니다. 코드명은 GB2312-80으로 총 6763개의 한자와 682개의 그래픽 문자를 인코딩했습니다. 원칙은 다음과 같습니다. 한자는 2바이트로 표시됩니다.
원칙적으로 2바이트는 256×256=65536개의 서로 다른 기호를 나타낼 수 있으며 이는 한자 인코딩 표현의 기초로 가능합니다. 그러나 한자 인코딩과 ASCII 서양 문자 인코딩과 같은 기타 국제 범용 인코딩 간의 관계를 고려하여 우리나라 국가표준국에서는 2바이트 중 하위 7비트만 사용하는 수정된 2바이트 한자 문자 인코딩 체계를 채택했습니다.
이 솔루션은 128×128=16384개의 다양한 한자를 수용할 수 있지만 표준 ASCII 코드와 호환되기 위해 32개의 제어 기능 코드, 코드 값이 32인 공백 및 127의 opcode를 각 바이트에 사용할 수 없습니다. . 따라서 바이트당 94개의 인코딩만 있을 수 있습니다. 이런 식으로 두 자리 7자리로 표현할 수 있는 실제 단어 수는 94×94=8836입니다.
더 많은 관련 글을 보시려면 PHP 중국어 홈페이지를 방문해주세요! !
위 내용은 한자의 내부 코드를 저장하려면 몇 바이트가 필요합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!