Wie konvertiere ich eine XML-Datei in einen Pandas-DataFrame mit sechs spezifischen Spalten?

Susan Sarandon
Freigeben: 2024-11-16 15:09:03
Original
633 Leute haben es durchsucht

How to Convert an XML File to a Pandas DataFrame with Six Specific Columns?

XML mit Leichtigkeit in Pandas DataFrame konvertieren

Problem:

Gegeben ist eine XML-Datei mit Wenn Sie eine bestimmte Struktur haben, besteht die Aufgabe darin, sie in einen sauberen und organisierten Pandas-DataFrame mit sechs Spalten umzuwandeln: „Schlüssel“, „Typ“, 'Sprache', 'Funktion', 'Web' und 'Daten'.

Lösung:

Die effizienteste Methode, diese Konvertierung durchzuführen, ist die Verwendung des Python-Standards 'xml'-Bibliothek. Diese Bibliothek bietet eine einfache Möglichkeit, XML-Daten zu analysieren und zu bearbeiten. So gehen Sie vor:

  1. XML analysieren: Parsen Sie die XML-Datei mit der Klasse „ElementTree“ aus der Bibliothek „xml“ in ein ElementTree-Objekt.
  2. Über Autoren iterieren: Aus dem geparsten XML über jeden „Autor“ iterieren Tag.
  3. Dokumentdaten extrahieren: Für jeden „Autor“ iterieren Sie über seine untergeordneten „Dokument“-Elemente und extrahieren Sie die gewünschten Daten.
  4. Erstellen Sie ein Wörterbuch für jedes Dokument: Erstellen Sie ein Wörterbuch für jedes „Dokument“, das die relevanten Daten, einschließlich des Textes, enthält Inhalt.
  5. Wörterbücher in DataFrame konvertieren: Schließlich konvertieren Sie die Liste der Wörterbücher in einen Pandas-DataFrame.

Code-Snippet:

import pandas as pd
import xml.etree.ElementTree as ET

xml_data = "<author..>...</author>" # Replace with your XML string

etree = ET.parse(xml_data)

def iter_docs(author):
    for doc in author.iter('document'):
        doc_dict = author.attrib.copy()
        doc_dict.update(doc.attrib)
        doc_dict['data'] = doc.text
        yield doc_dict

doc_df = pd.DataFrame(list(iter_docs(etree.getroot())))

print(doc_df)
Nach dem Login kopieren

Diese Methode gewährleistet eine systematische und effiziente Konvertierung der XML-Daten in einen DataFrame, der den gewünschten Anforderungen entspricht Format.

Das obige ist der detaillierte Inhalt vonWie konvertiere ich eine XML-Datei in einen Pandas-DataFrame mit sechs spezifischen Spalten?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage