> 백엔드 개발 > XML/RSS 튜토리얼 > XML 기본 사항: 구조 및 구문

XML 기본 사항: 구조 및 구문

巴扎黑
풀어 주다: 2017-03-19 15:40:30
원래의
1482명이 탐색했습니다.

[소개] 이제 메모장을 사용하여 xml 파일을 만들어 보겠습니다. 먼저 XML 파일을 살펴 보겠습니다.              name〉 "메모장"을 사용하여 xml 파일을 만듭니다. 먼저 XML 파일을 살펴보세요.

예제 1


〈?xml version="1.0" encoding="gb2312" ?〉 
  〈参考资料〉 
   〈书籍〉 
   〈名称〉XML入门精解〈/名称〉 
   〈作者〉张三〈/作者〉 
   〈价格 货币单位="人民币"〉20.00〈/价格〉 
   〈/书籍〉 
   〈书籍〉 
   〈名称〉XML语法〈/名称〉 
   〈!--此书即将出版--〉 
   〈作者〉李四〈/作者〉 
   〈价格 货币单位="人民币"〉18.00〈/价格〉 
   〈/书籍〉 
  〈/参考资料〉
로그인 후 복사



일반적인 XML 파일입니다. 편집 후 확장자가 .xml인 파일로 저장됩니다. 이 파일을 파일 서문(PROlog)과 파일 본문의 두 가지 주요 부분으로 나눌 수 있습니다. 이 파일의 첫 번째 줄은 파일 서문입니다. 이 줄은 XML 파일이 선언해야 하는 항목이며 XML 파일의 첫 번째 줄에도 있어야 합니다. 주로 XML 파서의 작동 방법을 알려줍니다. 그 중 버전은 이 XML 파일에 사용되는 표준 버전 번호로 필수이며, 인코딩은 이 XML 파일에 사용되는 문자 유형을 지정하며, 이 구문을 생략할 경우 다음 문자 코드는 유니코드 문자 코드여야 합니다. (생략하지 않는 것이 좋습니다.) 이 예에서는 GB2312 문자 코드를 사용하고 있으므로 인코딩 문을 생략할 수 없습니다. 파일의 서문에도 몇 가지 선언문이 있는데, 이에 대해서는 나중에 소개하겠습니다.

파일의 나머지 부분은 파일 본문에 속하며 XML 파일의 내용 정보가 여기에 저장됩니다. 파일의 본문이 시작 및 끝 제어 태그로 구성되어 있음을 알 수 있습니다. 이를 XML 파일의 "루트 요소"라고 합니다. 루트 요소 바로 아래에는 "Book" 아래에 "Name", "Author" 및 "Price"와 같은 하위 요소가 있습니다. 통화 단위는 요소의 "속성"이고 "RMB"는 "속성 값"입니다.

 〈!--이 책은 곧 출간됩니다--〉이 문장은 HTML과 동일하며, XML 파일에서 주석 부분은 "〈!--" 사이에 배치됩니다. 부품 사이에는 "-->" 태그가 있습니다.

보시다시피 XML 파일은 매우 간단합니다. HTML과 마찬가지로 XML 파일도 일련의 태그로 구성됩니다. 그러나 XML 파일의 태그는 자체 사용자 정의 태그이므로 태그 내용의 의미를 명확하게 설명할 수 있습니다.

XML 파일에 대한 대략적인 인상을 받은 후, XML 파일의 구문에 대해 자세히 이야기해 보겠습니다. 문법에 대해 이야기하기 전에 중요한 개념인 XML Parse를 이해해야 합니다.

1. XML 파서

파서의 주요 기능은 XML 파일에 구조적 오류가 있는지 확인하고 XML 파일의 태그를 제거한 후 올바른 내용을 읽어오는 것입니다. 원스텝 신청 처리로 넘어갑니다. XML은 파일 정보를 구조화하는 데 사용되는 마크업 언어입니다. XML 사양에는 파일 구조를 표시하는 방법에 대한 자세한 규칙이 있습니다. 파서는 이러한 규칙에 따라 작성된 소프트웨어입니다(주로 Java로 작성됨). HTML과 마찬가지로 브라우저에도 HTML 파서가 있어야 브라우저가 HTML 태그로 구성된 다양한 웹 페이지를 "읽고" 우리 앞에 표시할 수 있습니다. 브라우저의 HTML 파서가 읽을 수 없는 태그가 있는 경우 오류 메시지가 반환됩니다.

현재 HTML 태그는 사실 상당히 혼란스럽고 비표준 태그(일부 웹페이지는 IE에서는 정상적으로 표시될 수 있지만 Netscape Navigator에서는 표시되지 않음)가 많기 때문에 처음부터 디자이너들은 XML의 구문과 구조는 엄격하게 규정되어 있습니다. 우리가 작성하는 XML 파일은 이러한 규정을 준수해야 합니다. 그렇지 않으면 XML 파서가 오류 메시지를 무자비하게 표시합니다.

XML 파일에는 두 가지 유형이 있습니다. 하나는 Well-Formed XML 파일이고 다른 하나는 Validating XML 파일입니다.

XML 파일이 XML 사양의 특정 관련 규칙을 충족하고 DTD(문서 형식 정의 - 자세한 내용은 나중에 설명)를 사용하지 않으면 Well-Formed라고 할 수 있습니다. XML 파일이 올바른 형식이고 DTD가 올바르게 사용되고 DTD의 구문이 올바른 경우 파일은 유효성 검사 중입니다. 두 개의 XML 파일에 해당하는 두 개의 XML 파서가 있는데, 하나는 Well-Formed 파서이고 다른 하나는 Validating 파서입니다. IE 5에는 Well-Formed XML 파일을 구문 분석하는 데에도 사용할 수 있는 유효성 검사 구문 분석기가 포함되어 있습니다.

Well-Formed 조건을 만족하는지 확인해보세요. 방금 편집한 첫 번째 XML 파일을 IE 5 이상의 브라우저에서 열 수 있습니다.

왜 브라우저에 표시되는 내용이 내 소스 파일과 같은지 궁금하시죠? 맞습니다. XML 파일의 경우 내용만 알고 표시 형식은 CSS 또는 XSL로 완성되기 때문입니다. 여기서는 이 XML 파일에 대한 CSS 또는 XSL 파일을 정의하지 않았으므로 원래 형식으로 표시됩니다. 실제로 전자 데이터 교환에는 XML 파일만 필요합니다. 이를 어떤 형식으로 표시하려면 CSS 또는 XSL 파일을 편집해야 합니다(이 문제는 나중에 논의됩니다).

2. Well-Formed XML 파일

파서가 XML을 올바르게 구문 분석하고 브라우저에 표시하려면 XML이 Well-Formed여야 한다는 것을 알고 있습니다. 그렇다면 Well-Formed XML 파일이란 무엇입니까? XML 파일을 생성할 때 반드시 준수해야 하는 지침은 주로 다음과 같습니다.

우선 XML 파일의 첫 번째 줄에서는 해당 파일이 XML 파일임을 선언하고 해당 파일이 사용하는 XML 사양 버전을 선언해야 합니다. 파일 앞에는 다른 요소나 설명이 있을 수 없습니다.

둘째, XML 파일에는 루트 요소가 하나만 있을 수 있습니다. 첫 번째 예에서는 〈References〉...〈/References〉가 이 XML 파일의 루트 요소입니다.

셋째, XML 파일의 태그는 올바르게 닫혀야 합니다. 즉, XML 파일에서 제어 태그에는 해당 닫는 태그가 있어야 합니다. 예를 들어 태그에는 해당하는 닫는 태그가 있어야 합니다. HTML과 달리 일부 태그의 닫는 태그는 선택 사항입니다. 종료 태그가 없는 HTML의 XML 기본 사항: 구조 및 구문와 유사한 XML 파일에서 자체 포함된 단위 태그가 발견되면 XML은 이를 "빈 요소"라고 부르며 쓰기 방법을 사용해야 합니다. 〈빈 요소 이름/〉 요소에 속성이 포함된 경우 작성 방법은 〈빈 요소 이름 속성 이름 = "속성 값"/〉입니다.

넷째, 표시가 교차되어서는 안 됩니다. 이전 HTML 파일에서는 다음과 같이 작성할 수 있습니다.

 〈B〉〈H〉XXXXXXX〈/B〉〈/H〉,〈B〉 및 〈H〉

겹치는 부분이 있습니다. 하지만 XML에서는 인터리브된 태그를 작성하는 것이 엄격히 금지되어 있으며 태그는 규칙적인 순서로 나타나야 합니다.

다섯째, 속성 값은 " " 기호로 묶어야 합니다. 첫 번째 예에서는 "1.0", "gb2312", "RMB"와 같습니다. 모두 " "로 둘러싸여 있으므로 놓칠 수 없습니다.

여섯째, 영문 제어 태그, 명령어, 속성 이름은 대소문자를 구분해야 합니다. HTML과 달리 HTML에서는 와 같은 태그가 동일한 의미를 갖는 반면, XML에서는 , 또는 과 같은 태그가 다릅니다.

일곱째, HTML 파일에서 우리가 입력한 내용을 브라우저가 그대로 표시하도록 하려면 〈pre〉〈/pre〉 또는 〈 xmp〉〈/xmp〉 표시에 이러한 내용을 넣을 수 있습니다. 중간. HTML의 소스 코드가 웹 페이지에 표시되어야 하기 때문에 이는 HTML 교육 웹 페이지를 만드는 데 필수적입니다. XML에서는 이러한 기능을 구현하려면 CDATA 태그를 사용해야 합니다. CDATA 태그의 정보는 파서에 의해 그대로 애플리케이션에 전달되며 정보 세그먼트의 모든 제어 태그는 구문 분석되지 않습니다. CDATA 영역은 시작 표시로 ">"로 표시됩니다. 예: 예제 2의 소스 코드에서 "
예시 2

 〈![CDATA[flying xml〉〉〉〉〉,:-)
oooo〈〈〈〈〈〈 >〉

여덟째, XML은 HTML과 다르게 공백 문자를 처리합니다. HTML 표준에서는 공백이 아무리 많아도 하나의 공백으로 처리한다고 규정하고 있지만, XML에서는 파서가 처리를 위해 태그 이외의 모든 공백을 다운스트림 애플리케이션에 충실히 전달해야 한다고 규정되어 있습니다. 이런 식으로 HTML 파일을 작성할 때 들여쓰기 습관을 버려야 하는 경우가 있습니다. 왜냐하면 파서가 들여쓰기된 공백도 처리해야 하기 때문입니다. 예:

〈Author〉Zhang San〈/Author〉

〈Author〉
Zhang San
〈/Author>

위 내용은 파서는 다릅니다(후자는 태그에 Zhang San 문자 외에 두 개의 줄 바꿈 표시와 "Zhang San" 앞에 텍스트 들여쓰기 기호도 포함합니다). 따라서 파서는 표시를 제거하고 정보를 애플리케이션에 전달한 후 처리 결과가 달라집니다.

태그의 공백은 명확한 의미를 가지며 함부로 제거해서는 안 된다는 점을 XML 프로그램에 명확하게 알리고 싶다면(예를 들어 일부 시에서는 공백이 특정 의미를 가짐) XML 태그를 추가할 수 있습니다. 태그 내장 속성 - xml:space. 예를 들어(속성 이름 및 값의 경우 참고):  

  Poetry xml:space="preserver"">
  Motherland! 모국!
나의 조국!
  〈/Poem>

또한 XML 파일에서 표 1의 특수문자를 사용하려면 해당 기호로 바꿔야 한다.

표 1

특수 문자 대체 기호
&& &
>
요약하자면 위의 요구 사항을 충족하는 XML 파일은 Well-Formed XML 파일. 이는 XML 파일을 작성하기 위한 가장 기본적인 요구 사항입니다. XML 파일의 구문이 HTML의 구문보다 훨씬 엄격하다는 것을 알 수 있습니다. 이러한 엄격한 규정으로 인해 소프트웨어 엔지니어는 HTML 언어용 파서를 작성하는 것과는 달리 다양한 웹 페이지 작성 방법에 적응하고 자체 브라우저의 적응성을 향상시키기 위해 열심히 노력해야 합니다. 사실, 이것은 우리 초보자들에게도 좋은 일입니다. 그냥 하고 싶은 대로 하세요. 이전처럼 다양한 HTML을 어떻게 작성해야 할지 고민하지 마세요.

XML 파일에서는 대부분의 사용자 정의 태그가 사용되는 것을 볼 수 있습니다. 그런데 생각해보면, 같은 업종에 종사하는 A, B 두 회사가 XML 파일을 이용하여 서로 데이터를 교환하고자 한다면, A 회사는 태그를 사용하여 제품의 가격 정보를 나타내고, B 회사는 태그를 사용할 수 있습니다. 가격> 가격 정보를 나타냅니다. XML 애플리케이션이 해당 XML 파일의 정보를 읽는 경우 태그가 가격 정보를 나타낸다는 것만 알면 B사의 가격 정보를 읽을 수 없으며 오류가 발생합니다. 분명히 XML 파일을 사용하여 정보를 교환하려는 엔터티의 경우 그들 사이에 합의가 있어야 합니다. 즉, XML 파일을 작성하는 데 사용할 수 있는 태그, 상위 요소에 포함될 수 있는 하위 요소, 순서 각 요소가 어떤 요소로 나타나는지, 속성을 정의하는 방법 등이 나와 있습니다. 이렇게 하면 XML로 데이터를 교환할 때 원활한 통신이 가능합니다. 이 규칙을 DTD(Document Type Definition, 문서 형식 정의)라고 합니다. DTD를 XML 파일 작성을 위한 템플릿으로 생각할 수 있습니다. 동일한 업계 간의 XML 데이터 교환의 경우 고정된 DTD를 갖는 것이 훨씬 더 편리합니다. 예를 들어, 인터넷상의 주요 전자 쇼핑몰의 XML 웹 페이지가 모두 동일한 DTD를 따른다면, 우리는 이 DTD를 기반으로 애플리케이션을 쉽게 작성하여 온라인에서 관심 있는 항목을 자동으로 캡처할 수 있습니다. 실제로 앞서 언급한 MathML, SMIL 등과 같이 잘 정의된 DTD가 이미 여러 개 있습니다.

XML 파일이 올바른 형식이고 DTD를 기반으로 올바르게 생성된 경우 XML 파일 이름은 Validating XML file입니다. 해당 파서는 Validating Parser라고 합니다.                                                                            

위 내용은 XML 기본 사항: 구조 및 구문의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿