XML mit Leichtigkeit in Pandas DataFrame konvertieren
Problem:
Gegeben ist eine XML-Datei mit Wenn Sie eine bestimmte Struktur haben, besteht die Aufgabe darin, sie in einen sauberen und organisierten Pandas-DataFrame mit sechs Spalten umzuwandeln: „Schlüssel“, „Typ“, 'Sprache', 'Funktion', 'Web' und 'Daten'.
Lösung:
Die effizienteste Methode, diese Konvertierung durchzuführen, ist die Verwendung des Python-Standards 'xml'-Bibliothek. Diese Bibliothek bietet eine einfache Möglichkeit, XML-Daten zu analysieren und zu bearbeiten. So gehen Sie vor:
Code-Snippet:
import pandas as pd import xml.etree.ElementTree as ET xml_data = "<author..>...</author>" # Replace with your XML string etree = ET.parse(xml_data) def iter_docs(author): for doc in author.iter('document'): doc_dict = author.attrib.copy() doc_dict.update(doc.attrib) doc_dict['data'] = doc.text yield doc_dict doc_df = pd.DataFrame(list(iter_docs(etree.getroot()))) print(doc_df)
Diese Methode gewährleistet eine systematische und effiziente Konvertierung der XML-Daten in einen DataFrame, der den gewünschten Anforderungen entspricht Format.
Das obige ist der detaillierte Inhalt vonWie konvertiere ich eine XML-Datei in einen Pandas-DataFrame mit sechs spezifischen Spalten?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!