Bei der Arbeit mit XML-Daten in Python kann die Gewährleistung der Lesbarkeit und Struktur das Verständnis und die Wartbarkeit Ihres Codes erheblich verbessern. Das hübsche Drucken von XML, das heißt das Formatieren mit geeigneten Einrückungen und Zeilenumbrüchen, ist eine wertvolle Technik zum Erreichen dieser Ziele.
In diesem Artikel untersuchen wir zwei verschiedene Möglichkeiten, XML mit Python hübsch zu drucken: xml.dom.minidom und xml.etree.ElementTree. Durch das Verständnis dieser Methoden können Entwickler XML-Daten effektiv organisiert und optisch ansprechend präsentieren und so die Analyse und Bearbeitung erleichtern.
Hier sind die beiden Möglichkeiten, wie wir in Python einen hübschen Druck durchführen können –
Hier sind die Schritte, die wir unternehmen werden, um mit xml.dom.minidom ein hübsches Drucken durchzuführen -
Importieren Sie die erforderlichen Module: Wir importieren zunächst das Modul „xml.dom.minidom“, das eine einfache Implementierung der Document Object Model (DOM) API für die XML-Analyse bereitstellt.
Definieren Sie die Funktion „pretty_print_xml_minidom“: Diese Funktion akzeptiert eine XML-Zeichenfolge als Eingabe und ist für das Parsen und Verschönern des XML zum Drucken mit „xml.dom.minidom“ verantwortlich.
XML-String analysieren: Innerhalb der Funktion „pretty_print_xml_minidom“ verwenden wir die Methode „xml.dom.minidom.parseString()“, um den XML-String zu analysieren und ein DOM-Objekt zu erstellen.
XML mit hübschem Druck: Als Nächstes verwenden wir die Methode „toprettyxml()“ für das DOM-Objekt, um einen XML-String mit hübschem Druck zu generieren. Wir übergeben den Parameter „indent“ mit dem Wert „““, um die gewünschte Einrückungsstufe anzugeben (in diesem Fall zwei Leerzeichen).
Leere Zeilen entfernen: Standardmäßig fügt „toprettyxml()“ leere Zeilen zur Ausgabe hinzu. Um diese leeren Zeilen zu entfernen, teilen wir die hübsche XML-Zeichenfolge mit einem Zeilenumbruchzeichen („n“) auf, entfernen alle führenden oder nachgestellten Leerzeichen in jeder Zeile und verketten dann die nicht leeren Zeilen wieder miteinander.
Pretty XML drucken: Zum Schluss drucken wir den generierten Pretty XML-String.
Hier sind die Schritte, die wir befolgen werden, während wir mit xml.etree.ElementTree hübsches Drucken durchführen -
Importieren Sie die erforderlichen Module: Wir importieren zunächst das Modul `xml.etree.ElementTree`, das eine schnelle und effiziente API zum Parsen und Bearbeiten von XML bereitstellt.
Definition `indent` Funktion: Dies ist eine benutzerdefinierte Funktion, die zum rekursiven Hinzufügen von Einzügen zu XML-Elementen verwendet wird. Es akzeptiert einen `elem`-Parameter (XML-Element) und einen optionalen `level`-Parameter, um die aktuelle Einrückungsebene anzugeben (Standard ist 0).
Indent XML: In der Funktion `indent` fügen wir das Attribut indent > des XML-Elements hinzu, indem wir `text` und `tail` ändern. Das Attribut `text` stellt den Text unmittelbar nach dem öffnenden Tag dar, und das Attribut `tail` stellt den Text unmittelbar vor dem schließenden Tag dar. Durch das Hinzufügen von Einrückungen zu diesen Eigenschaften erzielen wir einen hübschen Druck.
Definition der Funktion `pretty_print_xml_elementtree: Diese Funktion verwendet einen XML-String als Eingabe und ist für das Parsen und Pretty-Printing des XML mithilfe von `xml.etree.ElementTree` verantwortlich.
XML-String analysieren: Innerhalb der Funktion `pretty_print_xml_elementtree` verwenden wir die Methode `ET.fromstring()`, um den XML-String zu analysieren und ein ElementTree-Objekt zu erstellen.
Indent XML: Wir rufen die Funktion `indent()` für das Stammelement des XML auf, um allen Elementen rekursiv Einrückungen hinzuzufügen.
XML-Elemente zurück in String konvertieren: Wir verwenden die Methode `ET.tostring()`, um XML-Elemente zurück in String-Darstellung zu konvertieren. Wir übergeben den Parameter „encoding“ mit dem Wert „unicode“, um die korrekte Kodierung der resultierenden Zeichenfolge sicherzustellen.
`xml.dom.minidom` bereitgestellte DOM-API, um XML zu analysieren und hübsch zu drucken, während das zweite Programm das `xml.etree.ElementTree`-Modul verwendet und eine benutzerdefinierte Funktion zum Hinzufügen von Einrückungen definiert rekursiv in XML-Elemente umwandeln.
Das Folgende ist ein Beispiel für ein Programm, das die beiden oben genannten Methoden verwendet -Option 1: Verwenden Sie xml.dom.minidom
import xml.dom.minidom def pretty_print_xml_minidom(xml_string): # Parse the XML string dom = xml.dom.minidom.parseString(xml_string) # Pretty print the XML pretty_xml = dom.toprettyxml(indent=" ") # Remove empty lines pretty_xml = "\n".join(line for line in pretty_xml.split("\n") if line.strip()) # Print the pretty XML print(pretty_xml) # Example usage xml_string = ''' <root> <element attribute="value"> <subelement>Text</subelement> </element> </root> ''' pretty_print_xml_minidom(xml_string)
<?xml version="1.0" ?> <root> <element attribute="value"> <subelement>Text</subelement> </element> </root>
import xml.etree.ElementTree as ET def indent(elem, level=0): # Add indentation indent_size = " " i = "\n" + level * indent_size if len(elem): if not elem.text or not elem.text.strip(): elem.text = i + indent_size if not elem.tail or not elem.tail.strip(): elem.tail = i for elem in elem: indent(elem, level + 1) if not elem.tail or not elem.tail.strip(): elem.tail = i else: if level and (not elem.tail or not elem.tail.strip()): elem.tail = i def pretty_print_xml_elementtree(xml_string): # Parse the XML string root = ET.fromstring(xml_string) # Indent the XML indent(root) # Convert the XML element back to a string pretty_xml = ET.tostring(root, encoding="unicode") # Print the pretty XML print(pretty_xml) # Example usage xml_string = ''' <root> <element attribute="value"> <subelement>Text</subelement> </element> </root> ''' pretty_print_xml_elementtree(xml_string)
<root> <element attribute="value"> <subelement>Text</subelement> </element> </root>
Das obige ist der detaillierte Inhalt vonHübsches Drucken von XML in Python. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!