XML 시작에 관해 자주 묻는 질문(3)-XML/RSS 튜토리얼-php.cn

집

백엔드 개발

XML/RSS 튜토리얼

XML 시작에 관해 자주 묻는 질문(3)

黄舟

Dec 22, 2016 pm 05:38 PM

xml

외국어, 특수문자가 포함된 문서는 어떻게 불러오나요?

문서에는 다음과 같은 외국 문자가 포함될 수 있습니다.

외국 문자(úóí?)

예를 들어, 磲와 같은 외국 문자는 다음과 같아야 합니다. 이스케이프 시퀀스가 앞에 옵니다. 외국 문자는 UTF-8로 인코딩되거나 다음과 같이 다른 인코딩으로 지정할 수 있습니다.

　외국 문자(磲)

이제 xml이 올바르게 로드됩니다.

다른 문자는 XML에 예약되어 있으므로 다르게 처리해야 합니다. 다음 XML:

This & that
은 다음 오류를 생성합니다.
여기에는 공백이 허용되지 않습니다.
행 0000001: 이것과 저것
위치 0000012: ----------^

여기서 &는 방금 배치된 경우 XML 구문 구조의 일부입니다. XML 데이터 소스 내에서는 &로 해석될 수 없습니다. "엔티티"라는 특수 문자 시퀀스를 바꿔야 합니다.

　This & that
다음 문자에는 해당 엔터티가 필요합니다.

　< <
　& &
　> >

따옴표 문자는 마크업에서 속성 값에 대한 구분 기호로 사용되므로 일반적으로 속성 값 내에서 사용할 수 없습니다. 예를 들어 다음은 오류를 반환합니다.

여기서 작은따옴표는 속성 구분 기호와 속성 값 자체 내에서 모두 사용됩니다. 이 문제를 해결하려면 속성 구분 기호를 큰따옴표로 변경할 수 있습니다.

또는 작은따옴표를 엔터티 '

로 이스케이프할 수 있습니다. 위의 두 방법 모두 XML 객체 모델 getAttribute 메소드는 John's Stuff의 속성 값을 반환합니다. 마찬가지로 큰따옴표의 경우

　" 엔터티를 사용할 수 있습니다.

CDATA 섹션에 텍스트를 배치하여 요소 콘텐츠의 특수 문자를 처리할 수도 있습니다. 올바른 내용은 다음과 같습니다.

예를 들어, XML 개체 모델은 CDATA 노드를 xml 노드의 하위 노드로 표시하고

　This & that is just "text" content.

　as nodeValue > 문자열을 반환합니다. Visual Studio 6.0 C++의 COM 구성 요소

Visual C++ 6.0에서 MSXML COM 구성 요소를 사용하는 가장 쉬운 방법은 #import 지시문을 사용하는 것입니다.

#import "msxml.dll "named_guids no_namespace# import "msxml.dll"named_guids no_namespace

　모든 IXML* 인터페이스와 인터페이스 ID를 정의하여 응용 프로그램에서 사용할 수 있도록 합니다. INETSDK(영어) 및 uuid.lib에서 MSXML 형식 라이브러리와 헤더 파일을 가져올 수도 있습니다. 클래스 IID가 포함되어 있습니다.

다음 XML에는 HTML 엔터티가 포함되어 있습니다.

다음 오류가 발생합니다.

정의되지 않은 엔터티 '복사본'에 대한 참조 줄: 1, 위치: 23, 오류 코드: 0xC00CE002
Copyright ? 2000, ...

----------^

이는 XML에 내장 엔터티가 5개만 있기 때문입니다. 내장 엔터티에 대해서는 외부 및 특수 문자가 포함된 문서를 로드하는 방법을 참조하세요. HTML 엔터티를 사용하려면 DTD를 사용하여 정의해야 합니다. 자세한 내용은 W3C XML 권장 사항(영문)을 참조하세요. 다음과 같이 DOCTYPE 태그에 직접 입력합니다.

IXMLDOMDocument 인터페이스의 verifyOnParse 속성을 해제합니다. 유효성 검사기 테스트 페이지에 붙여넣고 DTD 유효성 검사를 끈 다음 유효성 검사를 클릭하세요. 문서가 로드되고 유효성 검사기 페이지 끝에 있는 DOM 트리에 저작권 문자가 표시됩니다.

DTD 유효성 검사가 완료되면 매개변수 엔터티인 HTML 엔터티가 다음과 같이 기존 DTD에 포함되어야 합니다.

%HTMLENT;
% HTMLENT;

　 모든 HTML 엔터티를 XML 문서에서 사용할 수 있도록 정의합니다.

요소 콘텐츠에서 공백 문자를 처리하는 방법은 무엇입니까?

XML DOM에는 요소의 텍스트 콘텐츠에 액세스하는 세 가지 방법이 있습니다.

속성 동작

nodeValue는 원래 XML 소스에 지정된 대로 TEXT, CDATA, COMMENT 및 PI를 반환합니다. 노드의 원시 텍스트 콘텐츠(공백 문자 포함)입니다. ELEMENT 노드 및 DOCUMENT 자체의 경우 null이 반환됩니다.

Data NodeValue와 동일

Text 지정된 하위 트리의 여러 TEXT 및 CDATA 노드를 반복적으로 연결하고 결합된 결과를 반환합니다.

참고: 공백 문자에는 새 줄, 탭 및 공백이 포함됩니다.

nodeValue 속성은 일반적으로 문서가 로드된 방식과 현재 xml:space 범위에 관계없이 원본 문서의 콘텐츠를 반환합니다.

text 속성은 지정된 하위 트리의 모든 텍스트를 연결하고 엔터티를 확장합니다. 이는 문서가 로드되는 방식, PReserveWhiteSpace 스위치의 현재 상태 및 현재 xml:space 범위와 관련이 있습니다. 아래를 참조하세요.

PRESERVEWHITESPACE = TRUE 문서가 로드될 때

PreserVewhiteSpace = True PreservedSpace = True PreservewhiteSpace = FA LSE PRESERVEWHITESPACE = FALSE

XML: Space = XML 유지: Space = DEFAULT XML : space=preserve 🎜>preserveWhiteSpace=true PreserveWhiteSpace=true PreserveWhiteSpace=false

xml:space=preserve xml:space=default xml:space=preserve xml:space=default

절반 예약됨 세미 -reserved And truncate Half-preserved Half-preserved and truncated

여기서 보존한다는 것은 원본 텍스트 내용이 원본 XML 문서와 정확히 동일하다는 것을 의미하고, 잘림은 후행 공백이 제거되었습니다. 부분 보존은 "중요한 공백 문자"는 보존되고 "중요하지 않은 공백 문자"는 정규화됨을 의미합니다. 중요한 공백 문자는 텍스트 내용 내의 공백 문자입니다. 중요하지 않은 공백 문자는 토큰 사이의 공백 문자입니다. 다음과 같습니다. 빨간색은 무시할 수 있는 중요하지 않은 공백 문자인 반면, 녹색은 텍스트 콘텐츠의 일부이므로 중요한 의미를 갖기 때문에 무시할 수 없습니다. 무시되었습니다. 따라서 이 예에서 텍스트 속성은 다음을 반환합니다.

상태 반환 값

예약된 "nt JanentSmith n"

예약되고 잘린 "JanentSmith"

예약됨 " Jane Smith "
　

부분 보존되고 잘린 "Jane Smith"

"부분 보존"은 중요하지 않은 공백 문자를 정규화합니다. 예를 들어 개행 및 탭 문자는 줄어듭니다. 하나의 공간으로 . xml:space 속성과 PreserveWhiteSpace 스위치를 변경하면 텍스트 속성이 그에 따라 다른 값을 반환합니다.

CDATA 및 xml:space="preserve" 하위 트리 경계
아래 예에서 CDATA 노드 또는 "preserve" 노드의 콘텐츠는 중요하지 않은 공백 문자의 정규화에 참여하지 않기 때문에 연결됩니다. 예:

t Jane n

t Smith ]>n

이 경우 CDATA 노드 내부의 공백 문자는 no입니다. "중요하지 않은" 공백 문자와 더 긴 "병합"을 수행하고 잘리지 않습니다. 따라서 "절반 보존 및 잘림" 사례는 다음을 반환합니다. 콘텐츠가 관련이 없습니다. CDATA를 다음으로 바꾸면 동일한 결과가 반환됩니다.

Smith
엔터티는 특별합니다.

엔터티는 DTD의 일부로 로드 및 구문 분석되고 DOCTYPE 노드 아래에 표시됩니다. . xml:space 범위를 가질 필요는 없습니다. 예:

Jane n
tn

]>
태그 범위), 엔터티를 구문 분석할 때 중요하지 않은 공백 문자는 손실됩니다. 트리는 like:

DOCTYPE foo

ENTITY: Jane
ELEMENT: 직원

ELEMENT: 이름

TEXT: Jane

ELEMENT: title

TEXT>:Software Design Engineer

ELEMENT: foo

ATTRIBUTE: xml:space="preserve" > ENTITYREF: Jane

DOCTYPE 내부의 ENTITY 노드 아래에 노출된 DOM 트리에는 다음이 포함되지 않습니다. 모든 WHITESPACE 노드. 이는 엔터티 참조가 xml에 있더라도 ENTITYREF 노드의 하위 노드에 WHITESPACE 노드가 없음을 의미합니다. ENTITY의 각 인스턴스에도 마찬가지입니다. 특정 문서에서 참조되는 항목은 일반적으로 동일한 트리를 갖습니다. 엔터티가 공백 문자를 절대적으로 유지해야 하는 경우 내부적으로 자체 xml:space 속성을 지정하거나 문서 presentsWhiteSpace 스위치를 true로 설정해야 합니다.

속성에 액세스하는 방법에는 여러 가지가 있습니다. IXMLDOMAttribute 인터페이스에는 Microsoft 확장과 같은 nodeValue 속성이 반환됩니다. 속성에서 반환한 텍스트입니다.

　attrNode.nodeValue
　attrNode.value
　getAttribute("name")는 원본 문서와 정확히 동일한 콘텐츠(및 확장 엔터티)를 반환합니다.
　attrNode.nodeTypedValue Null
　attrNode.text는 앞뒤 공백 문자가 잘린 점을 제외하면 nodeValue와 동일합니다.

"XML 언어" 사양은 XML 애플리케이션에 대한 다음 동작을 정의합니다. 속성 유형
CDATA ID, IDREF, IDREFS, ENTITY, ENTITIES, NOTATION, Enumeration

반 정규화 전체 정규화

여기서 반 정규화는 새 줄과 탭 문자를 공백으로 변환하는 것을 의미하지만 여러 공백이 하나의 공백으로 변질되지는 않습니다.

위 내용은 XML 시작하기 FAQ(3) 내용입니다. 더 많은 관련 내용은 PHP 중국어 홈페이지(www.php.cn)를 참고해주세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7517

Cakephp 튜토리얼

1378

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

Related knowledge

PowerPoint를 사용하여 XML 파일을 열 수 있나요? Feb 19, 2024 pm 09:06 PM

XML 파일을 PPT로 열 수 있나요? XML, Extensible Markup Language(Extensible Markup Language)는 데이터 교환 및 데이터 저장에 널리 사용되는 범용 마크업 언어입니다. HTML에 비해 XML은 더 유연하고 자체 태그와 데이터 구조를 정의할 수 있으므로 데이터 저장과 교환이 더 편리하고 통합됩니다. PPT 또는 PowerPoint는 프레젠테이션 작성을 위해 Microsoft에서 개발한 소프트웨어입니다. 이는 포괄적인 방법을 제공합니다.

Python을 사용하여 XML 데이터 병합 및 중복 제거 Aug 07, 2023 am 11:33 AM

Python을 사용하여 XML 데이터 병합 및 중복 제거 XML(eXtensibleMarkupLanguage)은 데이터를 저장하고 전송하는 데 사용되는 마크업 언어입니다. XML 데이터를 처리할 때 여러 XML 파일을 하나로 병합하거나 중복된 데이터를 제거해야 하는 경우가 있습니다. 이 기사에서는 Python을 사용하여 XML 데이터 병합 및 중복 제거를 구현하는 방법을 소개하고 해당 코드 예제를 제공합니다. 1. XML 데이터 병합 XML 파일이 여러 개인 경우 이를 병합해야 합니다.

Python을 사용하여 XML 데이터 필터링 및 정렬 Aug 07, 2023 pm 04:17 PM

Python을 사용하여 XML 데이터 필터링 및 정렬 구현 소개: XML은 데이터를 태그 및 속성 형식으로 저장하는 일반적으로 사용되는 데이터 교환 형식입니다. XML 데이터를 처리할 때 데이터를 필터링하고 정렬해야 하는 경우가 많습니다. Python은 XML 데이터를 처리하는 데 유용한 많은 도구와 라이브러리를 제공합니다. 이 기사에서는 Python을 사용하여 XML 데이터를 필터링하고 정렬하는 방법을 소개합니다. XML 파일 읽기 시작하기 전에 XML 파일을 읽어야 합니다. Python에는 많은 XML 처리 라이브러리가 있습니다.

Python에서 XML 데이터를 CSV 형식으로 변환 Aug 11, 2023 pm 07:41 PM

Python의 XML 데이터를 CSV 형식으로 변환 XML(ExtensibleMarkupLanguage)은 데이터 저장 및 전송에 일반적으로 사용되는 확장 가능한 마크업 언어입니다. CSV(CommaSeparatedValues)는 데이터 가져오기 및 내보내기에 일반적으로 사용되는 쉼표로 구분된 텍스트 파일 형식입니다. 데이터를 처리할 때, 간편한 분석과 처리를 위해 XML 데이터를 CSV 형식으로 변환해야 하는 경우가 있습니다. 파이썬은 강력하다

PHP를 사용하여 XML 데이터를 데이터베이스로 가져오기 Aug 07, 2023 am 09:58 AM

PHP를 사용하여 데이터베이스로 XML 데이터 가져오기 소개: 개발 중에 추가 처리 및 분석을 위해 외부 데이터를 데이터베이스로 가져와야 하는 경우가 많습니다. 일반적으로 사용되는 데이터 교환 형식인 XML은 구조화된 데이터를 저장하고 전송하는 데 자주 사용됩니다. 이 기사에서는 PHP를 사용하여 XML 데이터를 데이터베이스로 가져오는 방법을 소개합니다. 1단계: XML 파일 구문 분석 먼저 XML 파일을 구문 분석하고 필요한 데이터를 추출해야 합니다. PHP는 XML을 구문 분석하는 여러 가지 방법을 제공하며 그 중 가장 일반적으로 사용되는 방법은 Simple을 사용하는 것입니다.

Python은 XML과 JSON 간의 변환을 구현합니다. Aug 07, 2023 pm 07:10 PM

Python은 XML과 JSON 간의 변환을 구현합니다. 소개: 일상적인 개발 프로세스에서 우리는 종종 서로 다른 형식 간에 데이터를 변환해야 합니다. XML과 JSON은 일반적인 데이터 교환 형식입니다. Python에서는 다양한 라이브러리를 사용하여 XML과 JSON을 변환할 수 있습니다. 이 문서에서는 코드 예제와 함께 일반적으로 사용되는 몇 가지 방법을 소개합니다. 1. Python에서 XML을 JSON으로 변환하려면 xml.etree.ElementTree 모듈을 사용할 수 있습니다.

Python을 사용하여 XML의 오류 및 예외 처리 Aug 08, 2023 pm 12:25 PM

Python을 사용하여 XML에서 오류 및 예외 처리하기 XML은 구조화된 데이터를 저장하고 표현하는 데 일반적으로 사용되는 데이터 형식입니다. Python을 사용하여 XML을 처리할 때 때때로 오류와 예외가 발생할 수 있습니다. 이 기사에서는 Python을 사용하여 XML의 오류 및 예외를 처리하는 방법을 소개하고 참조용 샘플 코드를 제공합니다. XML 구문 분석 오류를 잡기 위해 try-Exception 문을 사용하십시오. Python을 사용하여 XML을 구문 분석할 때 가끔 오류가 발생할 수 있습니다.

Python은 XML의 특수 문자와 이스케이프 시퀀스를 구문 분석합니다. Aug 08, 2023 pm 12:46 PM

Python은 XML의 특수 문자와 이스케이프 시퀀스를 구문 분석합니다. XML(eXtensibleMarkupLanguage)은 서로 다른 시스템 간에 데이터를 전송하고 저장하는 데 일반적으로 사용되는 데이터 교환 형식입니다. XML 파일을 처리할 때 특수 문자와 이스케이프 시퀀스가 포함되어 구문 분석 오류가 발생하거나 데이터가 잘못 해석될 수 있는 상황이 자주 발생합니다. 따라서 Python을 사용하여 XML 파일을 구문 분석할 때 이러한 특수 문자와 이스케이프 시퀀스를 처리하는 방법을 이해해야 합니다. 1. 특수문자 및

See all articles