Cara Menukar Fail XML kepada Bingkai Data Pandas
Menukar fail XML kepada DataFrame panda berstruktur boleh menjadi tugas yang berharga untuk data pemprosesan dan analisis. Berikut ialah pendekatan yang lebih baik untuk mencapai matlamat ini:
Menggunakan Perpustakaan XML Python
Pustaka standard Python menawarkan modul xml, khususnya [xml.etree.ElementTree](https ://docs.python.org/3/library/xml.etree.elementtree.html) submodul, yang menyediakan alat untuk menghuraikan dan memanipulasi data XML. Modul ini membenarkan proses penukaran yang mudah.
Lelaran Atas Elemen
Untuk menukar data XML kepada DataFrame, anda boleh menggunakan fungsi penjana untuk mengulang elemen dalam dokumen XML. Berikut ialah contoh fungsi penjana yang dipanggil iter_docs yang menghasilkan kamus yang mengandungi atribut dan kandungan teks
def iter_docs(author): author_attr = author.attrib for doc in author.iter('document'): doc_dict = author_attr.copy() doc_dict.update(doc.attrib) doc_dict['data'] = doc.text yield doc_dict
Menjana Dataframe
Setelah anda mempunyai fungsi penjana, anda boleh mencipta panda DataFrame menggunakan langkah berikut:
Berikut ialah contoh coretan kod yang menunjukkan proses ini:
import pandas as pd import xml.etree.ElementTree as ET etree = ET.parse('file_path') doc_df = pd.DataFrame(list(iter_docs(etree.getroot())))
Dengan melaksanakan pendekatan ini, anda boleh menukar data XML dengan cekap kepada panda berstruktur DataFrame, yang boleh dimanipulasi dan dianalisis selanjutnya untuk keperluan khusus anda.
Atas ialah kandungan terperinci Bagaimana untuk Menukar Fail XML kepada Pandas DataFrame dengan Perpustakaan XML Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!