Wie konvertiere ich eine XML-Datei in einen Pandas-DataFrame mit sechs spezifischen Spalten?-Python-Tutorial-php.cn

Heim

Backend-Entwicklung

Python-Tutorial

Wie konvertiere ich eine XML-Datei in einen Pandas-DataFrame mit sechs spezifischen Spalten?

Susan Sarandon

Nov 16, 2024 pm 03:09 PM

How to Convert an XML File to a Pandas DataFrame with Six Specific Columns?

XML mit Leichtigkeit in Pandas DataFrame konvertieren

Problem:

Gegeben ist eine XML-Datei mit Wenn Sie eine bestimmte Struktur haben, besteht die Aufgabe darin, sie in einen sauberen und organisierten Pandas-DataFrame mit sechs Spalten umzuwandeln: „Schlüssel“, „Typ“, 'Sprache', 'Funktion', 'Web' und 'Daten'.

Lösung:

Die effizienteste Methode, diese Konvertierung durchzuführen, ist die Verwendung des Python-Standards 'xml'-Bibliothek. Diese Bibliothek bietet eine einfache Möglichkeit, XML-Daten zu analysieren und zu bearbeiten. So gehen Sie vor:

XML analysieren: Parsen Sie die XML-Datei mit der Klasse „ElementTree“ aus der Bibliothek „xml“ in ein ElementTree-Objekt.
Über Autoren iterieren: Aus dem geparsten XML über jeden „Autor“ iterieren Tag.
Dokumentdaten extrahieren: Für jeden „Autor“ iterieren Sie über seine untergeordneten „Dokument“-Elemente und extrahieren Sie die gewünschten Daten.
Erstellen Sie ein Wörterbuch für jedes Dokument: Erstellen Sie ein Wörterbuch für jedes „Dokument“, das die relevanten Daten, einschließlich des Textes, enthält Inhalt.
Wörterbücher in DataFrame konvertieren: Schließlich konvertieren Sie die Liste der Wörterbücher in einen Pandas-DataFrame.

Code-Snippet:

import pandas as pd
import xml.etree.ElementTree as ET

xml_data = "<author..>...</author>" # Replace with your XML string

etree = ET.parse(xml_data)

def iter_docs(author):
    for doc in author.iter('document'):
        doc_dict = author.attrib.copy()
        doc_dict.update(doc.attrib)
        doc_dict['data'] = doc.text
        yield doc_dict

doc_df = pd.DataFrame(list(iter_docs(etree.getroot())))

print(doc_df)

Nach dem Login kopieren

Diese Methode gewährleistet eine systematische und effiziente Konvertierung der XML-Daten in einen DataFrame, der den gewünschten Anforderungen entspricht Format.

Das obige ist der detaillierte Inhalt vonWie konvertiere ich eine XML-Datei in einen Pandas-DataFrame mit sechs spezifischen Spalten?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn