Rumah > masalah biasa > teks badan

Apakah maksud perangkak web?

DDD
Lepaskan: 2023-06-20 16:39:45
asal
5687 orang telah melayarinya

Apakah maksud perangkak web?

Perangkak web ialah robot web yang direka untuk menyemak imbas World Wide Web secara automatik.

Pengenalan kepada perangkak web

Perangkak web, juga dikenali sebagai labah-labah web dan robot web, ialah program yang secara automatik merangkak maklumat daripada World Wide Web mengikut peraturan tertentu. atau skrip, dan nama lain yang kurang biasa digunakan termasuk semut, pengindeks automatik, emulator atau cacing.

Ciri-ciri perangkak web

Perangkak web ialah program yang mengekstrak halaman web secara automatik daripada World Wide Web untuk enjin carian komponen penting enjin carian. Secara tradisional, perangkak bermula dari URL satu atau beberapa halaman web awal dan memperoleh URL pada halaman web awal Semasa proses merangkak halaman web, ia terus mengekstrak URL baharu dari halaman semasa dan meletakkan mereka ke dalam baris gilir sehingga syarat berhenti tertentu sistem dipenuhi.

Jenis perangkak web

1. Perangkak web umum

rangkak web umum juga dipanggil perangkak rangkaian penuh beberapa URL benih ke Seluruh Web terutamanya mengumpul data untuk enjin carian tapak portal dan penyedia perkhidmatan Web yang besar ini mempunyai julat dan kuantiti merangkak yang besar, mempunyai kelajuan merangkak yang tinggi dan keperluan ruang storan, dan keperluan yang agak rendah untuk pesanan. merangkak halaman Pada masa yang sama, Memandangkan terdapat terlalu banyak halaman untuk dimuat semula, kerja selari biasanya digunakan, tetapi ia mengambil masa yang lama untuk memuat semula halaman sekali.

2. Perangkak web terfokus

Perangkak web terfokus, juga dikenali sebagai perangkak web topik, merujuk kepada perangkak web yang merangkak secara selektif halaman tersebut yang berkaitan dengan topik yang dipratentukan dan perangkak web umum Sebagai perbandingan , perangkak tertumpu hanya perlu merangkak halaman yang berkaitan dengan topik, yang sangat menjimatkan sumber perkakasan dan rangkaian Bilangan halaman yang disimpan juga kecil dan ia juga boleh memenuhi keperluan beberapa kumpulan tertentu untuk mendapatkan maklumat dalam bidang tertentu.

Aplikasi perangkak web

1. Data statistik

Alat utama untuk memperkaya data apabila data sejuk dimulakan. disebabkan oleh permulaan , jadi tidak banyak data Pada masa ini, kami perlu merangkak data dari platform lain untuk mengisi data perniagaan kami.

2. Crawler merebut tiket

Saya percaya bahawa setiap Festival Musim Bunga atau cuti, semua orang telah menggunakan beberapa perisian merebut tiket hanya untuk mendapatkan tiket penerbangan atau tiket kereta api, dan ini Sejenis perjalanan perisian menggunakan teknologi web crawler untuk mencapai tujuan merebut tiket seperti perisian merebut tiket akan sentiasa merangkak laman web tiket pengangkutan Setelah ada tiket, mereka akan mengklik untuk mengambil gambar dan meletakkannya di laman web mereka sendiri.

Atas ialah kandungan terperinci Apakah maksud perangkak web?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan