「ElementTree」を使用した Python での名前空間を含む XML の解析
さまざまなデータ ソースを操作しているときに、名前空間を含む XML に遭遇することがあります。そのようなケースの 1 つは、RDF を使用して公開されたオントロジーを扱うことであり、名前空間の使用が一般的です。これにより、Python の ElementTree ライブラリを使用してこのような XML を解析しようとすると問題が発生する可能性があります。
次の XML を考慮してください:
<rdf:RDF xml:base="http://dbpedia.org/ontology/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:owl="http://www.w3.org/2002/07/owl#" xmlns:xsd="http://www.w3.org/2001/XMLSchema#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns="http://dbpedia.org/ontology/"> <owl:Class rdf:about="http://dbpedia.org/ontology/BasketballLeague"> <rdfs:label xml:lang="en">basketball league</rdfs:label> <rdfs:comment xml:lang="en"> a group of sports teams that compete against each other in Basketball </rdfs:comment> </owl:Class> </rdf:RDF>
次のコードを使用してこの XML を解析しようとすると:
tree = ET.parse("filename") root = tree.getroot() root.findall('owl:Class')
に名前空間が存在するため、次のエラーが発生します。 XML:
SyntaxError: prefix 'owl' not found in prefix map
この名前空間の問題を解決するには、.find()、.findall()、および .iterfind() メソッドに明示的な名前空間辞書を提供する必要があります:
namespaces = {'owl': 'http://www.w3.org/2002/07/owl#'} # add more as needed root.findall('owl:Class', namespaces)
この名前空間辞書により、ElementTree は「owl:」プレフィックスの正しい名前空間 URL を検索し、
代わりに、優れた名前空間サポートを提供し、要素の .nsmap 属性で名前空間を自動的に収集する lxml ライブラリの使用に切り替えることもできます。
以上がPython の ElementTree を使用して名前空間を含む XML を解析するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。