HTML 기본 튜토리얼 컴퓨터 코딩(문자 세트)
컴퓨터 인코딩(문자 집합) -
컴퓨터는 바이너리 데이터만 처리할 수 있으므로 문자 집합이 있는 이유를 이해하세요. 컴퓨터가 인간의 언어(0-9, a-z, A-Z, 특수 기호)를 인식하려면 각 문자를 "인코딩"해야 합니다. 소위 "인코딩"은 각 문자가 서로 다른 이진 시스템으로 표시될 수 있음을 의미합니다.
가정: A는 이진수로 1000을 나타내고, B는 이진수로 1001을 나타냅니다.
ASCII 인코딩: 1바이트(8비트 이진수)를 사용하여 모든 문자를 표현하며 총 2^8 = 256.
ANSI 인코딩: 다른 국가에서는 ASCII 인코딩을 확장하여 자국의 언어를 표시했습니다.
ANSI는 중국 운영 체제에서 gb2312를 나타냅니다.
ANSI는 기존 운영 체제에서 big5를 나타냅니다.
일본 운영 체제에서 ANSI는 2바이트(16비트 바이너리)를 사용하는 JIS
...
를 나타냅니다( 표현하려면 총 2^16 = 65536자를 표현할 수 있습니다.
GB2312에는 총 6763자의 한자가 포함되어 있습니다
GBK 인코딩. : 예. GB2312에는 일부 비인기 문자, 희귀 문자, 고대 한자 등을 포함하도록 확장되었습니다. 총 21,000개의 한자가 포함됩니다. : 전 세계 모든 문자를 4바이트(32비트 바이너리)를 사용하여 균일하게 인코딩할 계획입니다.
단점: 인코딩 테이블 파일이 너무 크고 불편함. 32비트 바이너리를 사용하여 공간 낭비가 심함. -언어 인코딩)
문자가 다르면 번역에 적합한 인코딩을 선택합니다.
예: 1 ASCII 인코딩(8비트 바이너리)<을 사용할 수 있습니다. 🎜>