


Contoh menghuraikan dan memproses HTML/XML menggunakan PHP untuk mencipta perangkak web
Contoh penggunaan PHP untuk menghuraikan dan memproses HTML/XML untuk mencipta perangkak web
Pengenalan:
Perangkak web ialah alat automatik yang digunakan untuk merangkak data daripada World Wide Web. Sebagai bahasa skrip sebelah pelayan yang popular, PHP mempunyai perpustakaan dan fungsi yang kaya yang boleh menghuraikan dan memproses data dengan mudah dalam format HTML atau XML. Dalam artikel ini, kami akan memperkenalkan contoh membuat perangkak web menggunakan PHP dan memberikan contoh kod yang berkaitan.
- Dapatkan kandungan web
Sebagai perangkak, anda perlu mendapatkan kandungan halaman web sasaran terlebih dahulu. Dalam PHP, kita boleh menggunakan fungsi curl untuk mendapatkan kandungan halaman web. Berikut ialah contoh kod untuk mendapatkan kandungan web:
$url = "http://example.com"; $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); $output = curl_exec($ch); curl_close($ch); echo $output;
Dalam kod ini, kami menentukan URL untuk dirangkak dan menggunakan fungsi curl untuk menetapkan beberapa pilihan, seperti menetapkan CURLOPT_RETURNTRANSFER kepada benar untuk menyimpan kandungan yang diperoleh sebagai aksara rentetan. Akhir sekali, gunakan fungsi curl_exec untuk melaksanakan sesi curl dan simpan output ke dalam pembolehubah $output.
- Menghuraikan kandungan HTML
Selepas mendapatkan kandungan halaman web, langkah seterusnya ialah menghuraikan kandungan HTML untuk mengekstrak data yang diperlukan. PHP menyediakan banyak perpustakaan dan kaedah untuk memproses HTML, salah satu perpustakaan yang biasa digunakan ialah Simple HTML DOM, yang menyediakan antara muka yang ringkas dan mudah digunakan untuk menghuraikan HTML. Berikut ialah contoh kod yang menggunakan Simple HTML DOM untuk menghuraikan HTML:
include('simple_html_dom.php'); // 引入Simple HTML DOM库 $html = str_get_html($output); // 将网页内容加载到Simple HTML DOM对象中 // 找到所有链接并输出 foreach ($html->find('a') as $element) { echo $element->href . "<br>"; } $html->clear(); // 清除Simple HTML DOM对象占用的内存
Dalam kod ini, kami mula-mula memperkenalkan perpustakaan DOM HTML Mudah melalui fungsi include. Seterusnya, gunakan fungsi str_get_html untuk memuatkan kandungan halaman web yang diperoleh ke dalam objek DOM HTML Mudah. Kemudian, cari semua pautan menggunakan kaedah cari dan pemilih CSS, dan keluarkannya menggunakan gelung foreach. Akhir sekali, gunakan kaedah $html->clear untuk mengosongkan memori yang diduduki oleh objek DOM HTML Mudah.
- Menghuraikan kandungan XML
Selain menghuraikan HTML, PHP juga boleh menghuraikan kandungan XML dengan mudah. PHP menyediakan perpustakaan SimpleXML yang ringkas dan mudah digunakan untuk menghuraikan XML. Berikut ialah contoh kod yang menggunakan SimpleXML untuk menghuraikan XML:
$xml = simplexml_load_string($output); // 将XML字符串加载到SimpleXML对象中 // 遍历XML并输出特定字段的内容 foreach ($xml->book as $book) { echo "Title: " . $book->title . "<br>"; echo "Author: " . $book->author . "<br>"; echo "Year: " . $book->year . "<br><br>"; }
Dalam kod ini, kami menggunakan fungsi simplexml_load_string untuk memuatkan rentetan XML yang diperolehi ke dalam objek SimpleXML. Kemudian, gunakan gelung foreach dan sifat objek untuk melintasi XML dan mengeluarkan kandungan medan yang diperlukan.
Kesimpulan:
Menggunakan PHP untuk menghuraikan dan memproses HTML/XML memudahkan untuk membuat perangkak web dan mengekstrak data yang diperlukan daripada halaman web. Artikel ini memperkenalkan cara menggunakan fungsi curl PHP untuk mendapatkan kandungan halaman web dan cara menggunakan perpustakaan DOM HTML Mudah untuk menghuraikan HTML dan perpustakaan SimpleXML untuk menghuraikan kod sampel XML. Dengan menggunakan kuasa PHP dengan betul, kami boleh mencipta perangkak web kami sendiri dan membina pelbagai jenis aplikasi data dengan mudah.
Atas ialah kandungan terperinci Contoh menghuraikan dan memproses HTML/XML menggunakan PHP untuk mencipta perangkak web. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas





Pengenalan kepada fungsi Python: Pengenalan dan contoh fungsi exec Pengenalan: Dalam Python, exec ialah fungsi terbina dalam yang digunakan untuk melaksanakan kod Python yang disimpan dalam rentetan atau fail. Fungsi exec menyediakan cara untuk melaksanakan kod secara dinamik, membolehkan program menjana, mengubah suai dan melaksanakan kod seperti yang diperlukan semasa masa jalan. Artikel ini akan memperkenalkan cara menggunakan fungsi exec dan memberikan beberapa contoh kod praktikal. Cara menggunakan fungsi exec: Sintaks asas fungsi exec adalah seperti berikut: exec

Fungsi DECODE dalam Oracle ialah ungkapan bersyarat yang sering digunakan untuk mengembalikan hasil yang berbeza berdasarkan keadaan yang berbeza dalam pernyataan pertanyaan. Artikel ini akan memperkenalkan sintaks, penggunaan dan kod sampel bagi fungsi DECODE secara terperinci. 1. sintaks fungsi DECODE DECODE(expr,search1,result1[,search2,result2,...,default]) expr: ungkapan atau medan yang hendak dibandingkan. carian1,

Spesifikasi lekukan dan contoh bahasa Go adalah bahasa pengaturcaraan yang dibangunkan oleh Google Ia terkenal dengan sintaksnya yang ringkas dan jelas, yang mana spesifikasi lekukan memainkan peranan penting dalam kebolehbacaan dan keindahan kod. Artikel ini akan memperkenalkan spesifikasi lekukan bahasa Go dan menerangkan secara terperinci melalui contoh kod tertentu. Spesifikasi lekukan Dalam bahasa Go, tab digunakan untuk lekukan dan bukannya ruang. Setiap tahap lekukan ialah satu tab, biasanya ditetapkan kepada lebar 4 ruang. Spesifikasi sedemikian menyatukan gaya pengekodan dan membolehkan pasukan bekerjasama untuk menyusun

Pengenalan kepada fungsi Python: penggunaan dan contoh fungsi abs 1. Pengenalan kepada penggunaan fungsi abs Dalam Python, fungsi abs ialah fungsi terbina dalam yang digunakan untuk mengira nilai mutlak nilai tertentu. Ia boleh menerima hujah berangka dan mengembalikan nilai mutlak nombor itu. Sintaks asas fungsi abs adalah seperti berikut: abs(x) dengan x ialah parameter berangka untuk mengira nilai mutlak, yang boleh menjadi integer atau nombor titik terapung. 2. Contoh fungsi abs Di bawah kami akan menunjukkan penggunaan fungsi abs melalui beberapa contoh khusus: Contoh 1: Pengiraan

Pengenalan kepada fungsi Python: Penggunaan dan contoh fungsi isinstance Python ialah bahasa pengaturcaraan berkuasa yang menyediakan banyak fungsi terbina dalam untuk menjadikan pengaturcaraan lebih mudah dan cekap. Salah satu fungsi terbina dalam yang sangat berguna ialah fungsi isinstance(). Artikel ini akan memperkenalkan penggunaan dan contoh fungsi isinstance dan memberikan contoh kod khusus. Fungsi isinstance() digunakan untuk menentukan sama ada objek ialah contoh kelas atau jenis tertentu. Sintaks fungsi ini adalah seperti berikut

Pengenalan kepada fungsi Python: fungsi dan contoh fungsi eval Dalam pengaturcaraan Python, fungsi eval ialah fungsi yang sangat berguna. Fungsi eval boleh melaksanakan rentetan sebagai kod program, dan fungsinya sangat berkuasa. Dalam artikel ini, kami akan memperkenalkan fungsi terperinci bagi fungsi eval, serta beberapa contoh penggunaan. 1. Fungsi fungsi eval Fungsi fungsi eval adalah sangat mudah Ia boleh melaksanakan rentetan sebagai kod Python. Ini bermakna kita boleh menukar rentetan

Pengenalan kepada fungsi Python: fungsi dan contoh fungsi disusun Python ialah bahasa pengaturcaraan yang sangat berkuasa dengan pelbagai fungsi dan modul terbina dalam. Dalam siri artikel ini, kami akan memperkenalkan fungsi Python yang biasa digunakan satu demi satu dan memberikan contoh yang sepadan untuk membantu pembaca memahami dan menggunakan fungsi ini dengan lebih baik. Artikel ini akan memperkenalkan fungsi dan contoh fungsi yang disusun secara terperinci. Fungsi diisih digunakan untuk mengisih objek boleh lelar dan mengembalikan senarai diisih baharu. Boleh digunakan untuk nombor dan perkataan

Aplikasi dan analisis contoh pengendali titik PHP Dalam PHP, pengendali titik (".") ialah operator yang digunakan untuk menyambung dua rentetan Ia sangat biasa digunakan dan sangat fleksibel apabila menggabungkan rentetan. Dengan menggunakan pengendali titik, kita boleh menggabungkan berbilang rentetan dengan mudah untuk membentuk rentetan baharu. Berikut akan memperkenalkan penggunaan operator titik PHP melalui analisis contoh. 1. Penggunaan asas Mula-mula, mari kita lihat contoh penggunaan asas. Katakan terdapat dua pembolehubah $str1 dan $str2, yang masing-masing menyimpan dua perkataan.
