'ElementTree'를 통해 Python에서 네임스페이스로 XML 구문 분석
ElementTree는 특히 XML 문서를 구문 분석할 때 사용하는 Python의 강력한 라이브러리입니다. 네임스페이스가 있는 XML 문서입니다. 네임스페이스는 서로 다른 소스의 요소가 동일한 이름을 가질 때 이름 충돌을 방지하는 데 사용됩니다.
문제:
다음을 사용하여 여러 개의 중첩된 네임스페이스가 있는 XML 문서를 구문 분석하려고 합니다. ElementTree. 특히 모든 owl:Class 태그를 찾고 그 안에 있는 rdfs:label 인스턴스의 값을 추출하려고 합니다. 그러나 네임스페이스 존재로 인해 "SyntaxError: 접두사 'owl'은 접두사 맵에서 찾을 수 없습니다." 오류가 발생합니다.
해결책:
이 오류를 해결하려면 , ElementTree API의 .find(), .findall() 및 .iterfind() 메서드를 사용할 때 네임스페이스 사전을 지정해야 합니다. 이 사전은 네임스페이스 접두사를 해당 네임스페이스 URL에 매핑합니다. 코드를 조정하는 방법은 다음과 같습니다.
namespaces = {'owl': 'http://www.w3.org/2002/07/owl#'} root.findall('owl:Class', namespaces)
네임스페이스 사전을 전달하면 올빼미 접두어를 올바른 네임스페이스 URL로 확인하는 방법을 ElementTree에 명시적으로 알릴 수 있습니다. 필요에 따라 여러 접두사 및 URL을 전달할 수 있습니다.
대체 접근 방식:
또는 네임스페이스 사전에 의존하지 않고 다음 구문을 사용할 수 있습니다.
root.findall('{http://www.w3.org/2002/07/owl#}Class')
여기서 태그 앞에 중괄호로 묶인 네임스페이스 URL을 명시적으로 지정합니다. name.
권장 사항:
ElementTree에 비해 더 나은 네임스페이스 지원을 제공하는 lxml 라이브러리 사용을 고려해보세요. 요소의 .nsmap 속성에서 네임스페이스를 자동으로 수집합니다.
위 내용은 ElementTree를 사용하여 Python에서 네임스페이스로 XML을 어떻게 구문 분석할 수 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!