> 백엔드 개발 > XML/RSS 튜토리얼 > 미친 XML 연구 노트(2)------------형식 요구 사항

미친 XML 연구 노트(2)------------형식 요구 사항

黄舟
풀어 주다: 2017-02-21 14:04:18
원래의
1564명이 탐색했습니다.

Xml 구문

 XML 파일은 다음 부분으로 구분됩니다.

 문서 선언

요소

속성

 CDATA 영역, 특수문자

 처리 지침(처리 지침)

Xml 선언

가장 간단한 선언은

인코딩

속성

: 지정하지 않은 경우 문자 인코딩, 기본값은 UTF-8 인코딩

공통 문자 집합 중국어 간체: GBK

또는

GB2312

중국어 번체

: BIG5서유럽 문자: ISO8859-1

범용 국제 인코딩: 유니코드 UTF-8

데모 사례:

<중국>중국

>

오류 원인:

인코딩 오류


문자로 디코딩

tr>



解码成字符

xml 문자 집합이 잘못된 경우 문서




新建是一个.txt文档

保存的是.xml UTF-8

默认的编码ANSI

中国

새 문서는


写入到硬盘

编码成二进制码

00 11

.txt


磁盘文件

문서저장된 파일은 .xml UTF-8 기본 인코딩ANSI입니다. 중국
하드 디스크에 쓰기바이너리 코드로 인코딩00 11
디스크 파일

독립형:문서가 다른 리소스를 참조해야 하는지 지정,속성 값은 다음과 같습니다: 또는 아니오

: 독립 아니오: 독립하지 않음

XML 파일은 HTML 파일과 마찬가지로 실제로는 텍스트 파일입니다.

XML 파일을 생성하는 가장 일반적인 도구가 HTML과 동일한 "메모장"이라는 사실은 누구나 즉시 이해할 수 있습니다.

"메모장" 외에도 XML 메모장, XML Pro, CLIP 등 좀 더 편리한 도구도 물론 있습니다! XML 편집기 등,

이러한 도구의 주요 기능은 생성한 XML 파일이 XML 사양을 준수하는지 확인할 수 있다는 것입니다. 그러나 이러한 도구는 현재 영어로만 제공되며 결제가 필요합니다.

물론 FrontPage, DreamWeaver 등의 도구를 사용할 수는 있지만 사용하기가 그리 편리하지는 않습니다.

XML의 점진적인 인기로 인해 머지않아 XML 파일을 생성하는 데 매우 유용한 도구가 등장할 것이라고 믿습니다.
이제 "메모장"을 사용하여 XML 파일을 만들어 보겠습니다. 먼저 XML 파일을 살펴보세요.


예 1


〈? xml version="1.0" 인코딩="gb2312" ?〉
〈References〉
〈Books〉
〈Name〉XML 소개 〈/name〉
〈저자〉 Zhang San〈/저자 〉
〈Price Money Unit="RMB"〉20.00〈/Price〉
〈/Book〉
〈Book〉
〈Name〉XML Syntax〈/Name〉
〈!-- This 책 출간 예정-->
〈저자〉 李思〈/저자〉
〈Price Money Unit="RMB"〉18.00〈/Price〉
〈/Book〉
〈/Reference 자료 〉


일반적인 XML 파일입니다. 편집 후 확장자가 .xml인 파일로 저장하세요. 이 파일을 파일 서문(프롤로그)과 파일 본문의 두 가지 주요 부분으로 나눌 수 있습니다.

이 파일의 첫 번째 줄은 파일의 서문입니다. 이 줄은 XML 파일이 선언해야 하는 항목이며 XML 파일의 첫 번째 줄에도 있어야 합니다. 주로 XML 파서의 작동 방법을 알려줍니다.

그 중 버전은 이 XML 파일에 사용되는 표준 버전 번호를 나타내며, 인코딩은 이 XML 파일에 사용되는 문자 유형을 나타내며, 이 문을 생략할 경우 다음은 생략 가능합니다. 문자코드는 유니코드 문자코드여야 합니다(생략하지 않는 것이 좋습니다)

. 이 예에서는 GB2312 문자 코드를 사용하고 있으므로 인코딩 문을 생략할 수 없습니다. 파일의 서문에도 몇 가지 선언문이 있는데, 이에 대해서는 나중에 소개하겠습니다.


파일의 나머지 부분은 XML 파일의 내용 정보가 저장되는 파일 본문에 속합니다.

파일의 본문이 시작 및 끝 제어 태그로 구성되어 있음을 알 수 있습니다. 이를 XML 파일의 "루트 요소"라고 합니다. 직접적으로 사용됩니다. 아래에는 , 와 같은 하위 요소가 있는 루트 요소 아래의 "하위 요소"에 속합니다. 통화 단위는 요소의 "속성"이고 "RMB"는 "속성 값"입니다.


먼저 XML 파일의 첫 번째 줄에서는 해당 파일이 XML 파일임을 선언하고 해당 파일이 사용하는 XML 사양 버전을 선언해야 합니다. 파일 앞에는 다른 요소나 설명이 있을 수 없습니다.


둘째, XML 파일에는 루트 요소가 하나만 있을 수 있습니다. 첫 번째 예에서 〈References〉...〈/References〉는 이 XML 파일의 루트 요소입니다.


셋째, XML 파일의 태그는 올바르게 닫혀야 합니다. 즉, XML 파일에서 제어 태그에는 해당 닫는 태그가 있어야 합니다. 예를 들어 태그에는 해당하는 닫는 태그가 있어야 합니다. HTML과 달리 일부 태그의 닫는 태그는 선택 사항입니다. XML 파일에서 HTML의 미친 XML 연구 노트(2)------------형식 요구 사항과 유사하고 종료 태그가 없는 독립형 단위 태그가 발견되면 XML은 이를 "빈" 요소라고 부릅니다. "는 〈빈 요소 이름/〉과 같이 작성해야 합니다. 요소에 속성이 포함된 경우 〈빈 요소 이름 속성 이름="속성 값"/〉과 같이 작성해야 합니다.


넷째, 표시가 교차되어서는 안 됩니다. 이전 HTML 파일에서는 다음과 같이 작성할 수 있었습니다.
〈B〉〈H〉XXXXXXX〈/B〉〈/H〉, 〈B〉, 〈H〉
태그 사이에 겹치는 부분이 있고, XML에서는 이러한 태그 인터리빙이 엄격히 금지되며 태그는 규칙적인 순서로 나타나야 합니다.


다섯째, 속성 값은 " " 기호로 묶어야 합니다. 첫 번째 예에서는 "1.0", "gb2312", "RMB"와 같습니다. 모두 " "로 둘러싸여 있으며 생략할 수 없습니다.


여섯째, 영문 컨트롤 태그, 명령어, 속성 이름은 대소문자를 구분해야 합니다. HTML과 다르게 HTML에서는 , 와 같은 태그가 같은 의미를 갖는 반면, XML에서는 , , 과 같은 태그가 다릅니다.


일곱번째 , 우리는 HTML 파일에서 우리가 입력한 내용을 브라우저가 그대로 표시하도록 하려면 이러한 내용을 〈pre〉〈/pre〉에 넣거나 〈xmp〉〈/xmp〉가 중간을 표시한다는 것을 알고 있습니다. HTML의 소스 코드가 웹 페이지에 표시되어야 하기 때문에 이는 HTML 교육 웹 페이지를 만드는 데 필수적입니다. XML에서는 이러한 기능을 구현하려면 CDATA 태그를 사용해야 합니다. CDATA 태그의 정보는 파서에 의해 그대로 애플리케이션에 전달되며 정보 세그먼트의 모든 제어 태그는 구문 분석되지 않습니다. CDATA 영역은 시작 표시로 ">"로 표시됩니다. 예: 예제 2의 소스 코드에서 "


Xml 요소의 기본 규칙

기본 단위는 , xml 문서입니다. 레이어별로 중첩된 요소로 구성됩니다. 전체 xml 문서는 루트 요소 에서 시작하고 루트 요소에는 여러 하위 요소 , 가 포함되며 각 하위 요소에는 여러 하위 요소가 포함될 수 있습니다. , 이렇게 xml 문서를 구성할 수 있습니다.

Xml 태그 구문:

1

, > 

의 태그:

<중국>중국 >

2, xml 태그 요구 사항: 1, 태그 이름에는 문자 (

비서유럽 문자 포함

) , 숫자, 밑줄 (_), 밑줄 (- ), 콜론 (:)

및 마침표

(.), 형식이지만 숫자, 대시 및 마침표로 시작할 수 없습니다. 2, 태그 이름에는 <, >,,,$ 및 기타 기호

3

. 네임스페이스를 사용하지 않는 한 레이블 이름에 영어 콜론 (:), 을 사용하지 마세요. 4, 태그 이름은 xml,

XML

과 같이 대소문자 조합으로 시작할 수 없습니다. , 등. 5 태그 이름에는 공백이 포함될 수 없습니다.

6, 태그 이름은 대소문자를 구분합니다.

3, xml 태그 중첩 하위 요소: xml은 요소 간 합리적인 중첩이 보장되는 한 하위 요소의 깊은 중첩을 허용합니다. .이고 xml 요소는 동일한 이름 을 가진 여러 하위 요소를 중첩할 수 있으며 이러한 하위 요소는 순서가 지정됩니다.

첫 번째:xml

<중국 >

<베이징>

<하이뎬/>

<조양>조양 > 🎜>

베이징> 중국

>

두 번째

xml: <

중국

> <

베이징

>  <

조양

>조양>

<조양>조양>

🎜>/> 베이징>

중국>

4, 빈 요소: 빈 요소는 하위 요소를 허용할 수 없음,

도 허용할 수 없음 문자열 내용.

세 번째 xml

:

                                                                                                                                                   수락할 수 있음 여러 속성

                       

예를 들어, 빈 요소는 속성을 허용합니다:

  建议” price=”30”/>

5、字符数据

  

      Struts2开发详解

     

         Struts2开发详解

     

  

  对于XML标签中出现的所有空格和换行,XML解析程序都会当作标签内容进行处理

 如果文本字符中包含了一些特殊的字符,例如<&由于这些字符都有特殊的含义,因此直接在xml文档中使用该字符串将引起文档的混乱。

<表达式>

 

        <比较符>1+3<6比较符>

   表达式>

代表的是文本字符串中包含了特殊的字符

 

有以下两种方法解决:

1、 使用实体引用:用另一个特殊符号代替这些特殊符号

2、使用CDATA标记:将整个文档定义成字符串。

1、  使用实体引用

       

  <表达式>

        <比较符>1+3&<6比较符>

  表达式>

上面的红色的<产生了干扰

解决如下:

 

  <表达式>

        <比较符>1+3<6比较符>

표현식>

2, CDATA 사용 태그

특수 태그 아래 CDATA, 모든 특수 문자 , 도 유효한 요소로 처리됩니다. 간단한 문자열. 엔터티 참조도 효과를 잃고 직접적인 텍스트가 됩니다.

CDATA의 구문 형식은 다음과 같습니다.

텍스트 콘텐츠]]>

<표현식>

                                                                        1 +3<6< ㅋㅋㅋ> 🎜>

표현> ;

참고: xml 문서는

CDATA

태그 콘텐츠를 전혀 구문 분석하지 않으므로, , 따라서 모든 콘텐츠는 CDATA 내에 배치될 수 있으며, 콘텐츠는 결코 틀리지 않습니다.

1, 댓글

Xml

문서에 설명을 위한 문자 데이터를 추가할 수도 있습니다, 이러한 해석 문자열은 xml 파서에서 처리되지 않습니다. 이러한 설명 텍스트를 메모라고 합니다. Xml의 문서 설명은 html의 설명과 완전히 동일합니다.

문자열

-->

Xml 댓글에는 다음을 포함할 수 있습니다. 요소와 태그. 참고: 1. Xml

주석은 태그 본문에 넣을 수 없습니다.

2.

xml 문서 선언 xml 앞에 xml 문서를 넣지 마세요. document 명령문은 항상 첫 번째 줄에 있습니다

3. 주석에 이중 밑줄을 사용하지 마세요 (--)

…..

2. 처리 지침

참조 PI (처리 지침). 처리 지침은 XML 문서 콘텐츠를 구문 분석하는 방법을 구문 분석 엔진에 지시하는 데 사용됩니다.

처리 명령은 xml 문서를 처리하는 애플리케이션에 정보를 제공하는 데 사용됩니다. 는 프로세서에 문서 처리 방법을 알려줍니다. 완전한 xml 문서 처리 프로그램, xml 문서 처리 명령, 을 읽어 처리 명령, 또는 다음 프로그램으로 전달하세요.

Xml처리 명령의 형식은 다음과 같습니다.

처리 명령어 이름 처리 명령어 정보

속성

xml속성 특성:

1. 2. 동일한 xml 요소는 동일한 이름을 가진 여러 속성을 가질 수 없습니다.

3. Xml 요소의 여러 속성에는 순서가 없습니다.

93c968501103bb67c0b2770110f91f27

Xml 루트 요소가 있어야 합니다.

Xml문서 전체 구조

루트가 있어야 합니다. 요소(하나만 있습니다

)

2. 요소는 합리적으로 끝나야 합니다

3, 요소는 합리적으로 중첩되어야 합니다

4, 요소의 속성에는 속성 값이 있어야 합니다 ​​

위의 조건이 충족되지 않는 이상 형식이 잘못된 xml 문서입니다

위의 조건이 충족되면 잘 구성된 문서xml 문서

이며 dtd 또는 schema<🎜를 준수합니다. >은 유효한 xml

문서입니다.

🎜>루트 노드는 DOM 트리의 루트 노드에 해당합니다. 아아아앙




book

컴퓨터


computer


computer

컴퓨터


………


computer

<🎜><🎜><🎜>………<🎜><🎜>
<🎜> <🎜><🎜><🎜>
<🎜><🎜><🎜><🎜><🎜>컴퓨터<🎜 ><🎜>


name

이름


author

작성자

참고:

에는 루트 태그가 있어야 하며 루트 태그에는 고유해야 합니다시작 태그와 종료 태그는 쌍으로 사용해야 합니다

태그는 서로 바꿔서 사용할 수 없습니다

빈 태그는 "<

태그 이름

/>

"


태그 형식으로 작성할 수 있습니다. 대소문자 구분

위는 미친 XML 스터디 노트(2) 내용입니다------------ - 더 많은 관련 내용을 보시려면 PHP 중국어 홈페이지(www.php.cn)를 참고해주세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿