Dengan populariti Internet dan peningkatan dalam jumlah data, perangkak web telah menjadi bahagian yang amat diperlukan dalam pelbagai industri. Sebagai bahasa pengaturcaraan berprestasi tinggi, Go telah menjadi bahasa pilihan untuk lebih banyak projek perangkak. Walau bagaimanapun, dalam pembangunan sebenar, kita selalunya perlu mengawal benang perangkak, seperti apabila kita perlu menghentikan atau memulakan semula perangkak. Artikel ini akan membincangkan cara menghentikan urutan perangkak daripada perspektif bahasa Go.
1. Cara menghentikan utas dalam bahasa Go
Dalam bahasa Go, utas boleh diwakili oleh goroutine. Secara lalai, goroutine akan berjalan sehingga ia menyelesaikan tugas atau paniknya. Bahasa Go mempunyai mekanisme terbina dalam yang boleh menamatkan goroutine apabila ia tidak diperlukan lagi Mekanisme ini menggunakan saluran.
Dalam bahasa Go, saluran ialah jenis data yang boleh digunakan untuk memindahkan data antara gorouti yang berbeza. Saluran dicipta melalui fungsi make() dan boleh menentukan jenis dan kapasiti data yang dihantar dan diterima. Selain itu, saluran juga mempunyai beberapa kaedah, seperti saluran penutup, saluran bacaan, saluran penulisan, dll.
Kaedah untuk menutup saluran adalah seperti berikut:
close(stopChan)
Antaranya, stopChan ialah pembolehubah saluran yang kami takrifkan.
Jika saluran telah ditutup, anda akan mendapat nilai nol yang dipanggil "nilai sifar" apabila membaca data. Jika masih terdapat data yang belum dibaca dalam saluran, anda boleh melintasinya melalui pernyataan untuk julat, seperti yang ditunjukkan di bawah:
for data := range dataChan { fmt.Println(data) }
Apabila dilalui bahawa saluran telah ditutup dan tiada data yang belum dibaca, untuk Kitaran akan tamat secara automatik. Anda boleh mendengar berbilang saluran melalui penyataan pilih, seperti yang ditunjukkan di bawah:
select { case data := <-dataChan: // 处理data case <-stopChan: // 收到停止信号 return }
Dalam coretan kod di atas, apabila membaca dari stopChan saluran berhenti, isyarat berhenti akan diterima dan goroutine semasa akan keluar.
2. Cara menggunakan saluran dalam utas perangkak untuk kawalan henti
Dalam bahasa Go, utas utama program akan menunggu penghujung goroutine kanak-kanak, jadi menggunakan saluran dalam coroutine boleh mencapai berhenti Tujuan goroutine semasa.
Kita boleh menggunakan hentian pembolehubah jenis bool untuk menandakan sama ada goroutine semasa perlu dihentikan. Pek hentian pembolehubah Boolean ke dalam stopChan, dan kemudian dengarkan stopChan dalam goroutine perangkak, seperti yang ditunjukkan di bawah:
func Spider(stopChan chan bool) { stop := false for !stop { // 抓取数据 select { case <-stopChan: stop = true default: // 处理数据 } } }
Dalam coretan kod di atas, kami menetapkan tanda henti dalam fungsi Spider untuk mengawal sama ada benang perangkak Perlu berhenti. Dalam gelung sementara, kami mendengar stopChan, dan jika tanda berhenti diterima, berhenti ditetapkan kepada benar. Dalam cawangan lalai, kita boleh menulis kod berkaitan perangkak.
Kaedah untuk menutup benang crawler adalah seperti berikut:
close(stopChan)
Sudah tentu, kami juga boleh memproses saluran ini di pintu masuk program untuk mencapai kawalan henti bagi keseluruhan program.
3. Isu yang perlu diberi perhatian semasa menghentikan benang crawler
Apabila menggunakan saluran untuk mengawal benang untuk berhenti, terdapat beberapa isu yang perlu diberi perhatian.
Dalam beberapa kes, kita perlu menggunakan berbilang saluran untuk mengawal goroutine, seperti saluran untuk membaca data dan saluran untuk berhenti saluran. Pada masa ini, kita boleh menggunakan pernyataan pilih untuk memantau dua pembolehubah saluran.
Kami perlu melakukan kerja keluaran sumber yang diperlukan sebelum benang perangkak berhenti, seperti menutup sambungan pangkalan data, melepaskan memori, dsb.
Jika kita mencipta sejumlah besar coroutine, maka kita perlu mempertimbangkan isu mengawal bilangan coroutine, jika tidak, ia mungkin membawa kepada pembaziran sumber sistem Atau prestasi merosot. Anda boleh menggunakan saluran atau kumpulan coroutine untuk mengawal bilangan coroutine.
Akhir sekali, kebolehpercayaan komunikasi coroutine perlu dipertimbangkan. Oleh kerana saluran dikekalkan dalam ingatan, dan dalam beberapa amalan yang kompleks, mungkin terdapat beberapa kebergantungan yang kompleks antara coroutine. Oleh itu, kita perlu menangani isu komunikasi antara saluran dengan berhati-hati.
4. Ringkasan
Artikel ini membincangkan cara menghentikan urutan perangkak dari perspektif bahasa Go. Kita boleh menggunakan saluran untuk mengawal coroutine dan membenarkannya berhenti, dimulakan semula, dsb. Tetapi dalam pembangunan sebenar, kita juga perlu mempertimbangkan isu seperti kebolehpercayaan dan pelepasan sumber. Saya harap artikel ini dapat memberikan pembaca sedikit bantuan dalam pembangunan sebenar.
Atas ialah kandungan terperinci golang berhenti benang crawler. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!