Artikel ini akan memperkenalkan cara mengekstrak data daripada fail XML dan JSON di Internet. XML dan JSON adalah format data yang biasa digunakan pada masa ini, jadi sangat perlu untuk menguasai kaedah untuk mengekstrak maklumat berguna daripadanya.
1. Kaedah pengekstrakan data XML
XML (Extensible Markup Language) ialah bahasa penanda yang digunakan untuk menyimpan dan menghantar data. Data XML terdiri daripada tag, atribut, teks dan ulasan. Berikut ialah cara untuk mengekstrak data daripada fail XML melalui Python.
Modul ElementTree dalam Python ialah cara untuk memproses data XML. Ia boleh menghuraikan fail XML ke dalam objek Element Tree dan menyediakan satu siri kaedah untuk mengendalikan objek. Berikut ialah contoh mudah:
import xml.etree.ElementTree as ET tree = ET.parse('data.xml') root = tree.getroot() for child in root: print(child.tag, child.attrib)
Kod ini akan mencetak teg dan atribut setiap elemen dalam fail XML.
XPath ialah bahasa untuk memilih nod XML. Ia menyediakan cara yang mudah untuk mencari dan mengekstrak data XML. Untuk menggunakan XPath, anda boleh menggunakan kaedah Element.findall() dan Element.find() dalam modul ElementTree. Berikut ialah contoh:
import xml.etree.ElementTree as ET tree = ET.parse('data.xml') root = tree.getroot() # 获取所有book元素 books= root.findall('.//book') # 获取第一个book元素的author子元素的值 author = root.find(".//book[1]/author").text
Kod ini akan mendapat nilai semua elemen buku dalam fail XML dan sub-elemen pengarang bagi elemen buku pertama.
2. Kaedah pengekstrakan data JSON
JSON (JavaScript Object Notation) ialah format pertukaran data ringan yang strukturnya serupa dengan kamus dalam Python. Berikut ialah cara menggunakan Python untuk mengekstrak data daripada fail JSON.
Modul json dalam Python boleh menukar rentetan JSON kepada kamus atau senarai Python. Rentetan JSON boleh ditukar menjadi objek Python menggunakan kaedah json.loads(), seperti yang ditunjukkan di bawah:
import json json_str = '{"name": "Alice", "age": 25, "city": "New York"}' data = json.loads(json_str) print(data["name"])
Kod ini akan mengeluarkan "Alice".
Selepas menukar rentetan JSON kepada objek Python, ia boleh dimanipulasi sama seperti kamus dan senarai. Sebagai contoh, anda boleh menggunakan indeks untuk mendapatkan nilai untuk kunci. Berikut ialah contoh:
import json json_str = '{"name": "Alice", "age": 25, "city": "New York"}' data = json.loads(json_str) print(data["name"])
Kod ini akan mengeluarkan "Alice".
Ringkasan
Artikel ini memperkenalkan kaedah untuk mengekstrak data daripada fail XML dan JSON di web. Menggunakan modul ElementTree dan XPath dalam Python memudahkan untuk mengekstrak data daripada fail XML, sambil menggunakan modul json anda boleh menukar rentetan JSON ke objek Python dan kemudian memanipulasinya seperti kamus dan senarai. Menguasai kemahiran ini boleh membantu kami memproses data dengan lebih cekap.
Atas ialah kandungan terperinci Cara untuk mengekstrak data daripada fail XML dan JSON di web. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!