Convertir facilement du XML en Pandas DataFrame
Problème :
Étant donné un fichier XML avec une structure spécifique, la tâche consiste à la convertir en un DataFrame pandas propre et organisé avec six colonnes : "clé", "type", "langue", "fonctionnalité", "web" et "données".
Solution :
La méthode la plus efficace pour réaliser cette conversion consiste à utiliser la bibliothèque 'xml' standard de Python. Cette bibliothèque fournit un moyen simple d'analyser et de manipuler des données XML. Voici comment procéder :
Extrait de code :
import pandas as pd import xml.etree.ElementTree as ET xml_data = "<author..>...</author>" # Replace with your XML string etree = ET.parse(xml_data) def iter_docs(author): for doc in author.iter('document'): doc_dict = author.attrib.copy() doc_dict.update(doc.attrib) doc_dict['data'] = doc.text yield doc_dict doc_df = pd.DataFrame(list(iter_docs(etree.getroot()))) print(doc_df)
Cette méthode assure une conversion systématique et efficace des données XML en un DataFrame répondant au format souhaité.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!