이 글에서는 XML 코드 작성의 인코딩 및 검증 문제를 주로 소개합니다. HTML과 마찬가지로 XML 파일의 인코딩도 서문에 지정할 수 있습니다. 필요한 친구는
인코딩을 참조하세요.
인코딩은 유니코드 문자를 동등한 이진 표현으로 변환하는 프로세스입니다. XML 핸들러는 XML 문서를 읽을 때 인코딩 유형에 따라 문서를 인코딩합니다. 따라서 XML 선언에서 인코딩 유형을 지정해야 합니다.
인코딩 유형
인코딩에는 크게 두 가지 유형이 있습니다.
UTF-8
UTF-16
UTF는 UCS 변환 형식을 나타내며, UCS 자체는 범용 문자 집합을 의미합니다. . 숫자 8 또는 16은 문자를 나타내는 비트 수를 나타냅니다. 8(1바이트) 또는 16(2바이트)입니다. 인코딩 정보가 없는 문서의 경우 기본적으로 UTF-8이 사용됩니다.
구문
XML 문서의 프롤로그에는 인코딩 정보가 포함되어 있습니다. UTF-8 인코딩 구문은 다음과 같습니다.
<?xml version="1.0" encoding="UTF-8" standalone="no" ?>
UTF-16 인코딩 구문은 다음과 같습니다.
<?xml version="1.0" encoding="UTF-16" standalone="no" ?>
예
아래 예제에서는 인코딩 선언을 보여줍니다.
<?xml version="1.0" encoding="UTF-8" standalone="no" ?>Tanmay Patil TutorialsPoint (011) 123-4567
위의 인코딩="UTF-8" 예제에서는 8비트 문자를 표시하도록 지정합니다. 16자를 사용하려면 UTF-16 인코딩을 사용하세요.
UTF-8을 사용하여 인코딩된 XML 파일은 UTF-16 형식의 파일보다 크기가 더 작습니다.
유효성 검사
유효성 검사는 XML 문서의 유효성을 검사하는 프로세스입니다. 문서의 내용이 요소, 속성 및 연관된 문서 유형 정의(DTD)와 일치하고 문서가 b로 표현된 제약 조건을 준수하는 경우 문서는 유효한 것으로 간주됩니다. XML 파서를 통해 유효성 검사를 처리하는 방법에는 두 가지가 있습니다.
잘 구성된 XML 문서
유효한 XML 문서
잘 구성된 XML 문서
XML 문서는 다음 규칙을 따르는 경우 올바른 형식으로 간주됩니다.
DTD가 없는 XML 문서는 amp(&), apos(작은따옴표), g(>), quot(큰따옴표)를 처리하는 미리 정의된 문자 엔터티를 사용해야 합니다.
태그 순서를 따라야 합니다. 즉, 외부 태그가 닫히기 전에 내부 태그가 닫혀야 합니다.
각 시작 태그에는 종료 태그가 있거나 자체적으로 닫히는 태그(
다음은 올바른 형식의 XML 문서의 예입니다.
<?xml version="1.0" encoding="UTF-8" standalone="yes" ?> <!DOCTYPE address [ <!ELEMENT address (name,company,phone)> <!ELEMENT name (#PCDATA)> <!ELEMENT company (#PCDATA)> <!ELEMENT phone (#PCDATA)> ]> <address> <name>Tanmay Patil</name> <company>TutorialsPoint</company> <phone>(011) 123-4567</phone> </address>
위 예는 다음과 같은 이유로 올바른 형식으로 간주됩니다.
문서 유형을 정의합니다. 여기서 문서 유형은 요소 유형입니다.
에는 address라는 루트 요소가 포함되어 있습니다.
각 하위 요소 이름, 회사 및 전화번호는 설명이 필요 없으며 올바르게 닫힌 태그입니다.
태그 순서가 올바른지 확인하세요.
위 내용은 XML 코드 작성 시 인코딩 및 확인 문제에 대한 자세한 소개의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!