抓取原始碼 - php有沒有功能完整的網頁資料擷取開源專案呢

WBOY
發布: 2023-03-01 18:24:01
原創
1425 人瀏覽過

請問有沒有開源的工具來收集網頁的資料

例如要包含連續規則抓取,例如先抓取分頁信息,從中獲取詳情頁,從詳情頁抓取真正需要的dom字段

包含最後自訂存到資料庫,

包含可以偽造ip等

包含自動佇列機制,自動延遲

等等

謝謝

回覆內容:

請問有沒有開源的工具來收集網頁的資料

例如要包含連續規則抓取,例如先抓取分頁信息,從中獲取詳情頁,從詳情頁抓取真正需要的dom字段

包含最後自訂存到資料庫,

包含可以偽造ip等

包含自動佇列機制,自動延遲

等等

謝謝

有,可以試試【神箭手雲爬蟲開發平台。 】
神箭手雲爬蟲是幫助JS開發者快速開發爬蟲系統的SaaS服務平台。神箭手提供上手簡單,靈活開放的雲端爬蟲開發框架,讓開發者只需要在線上寫幾行js程式碼就可以實現一個爬蟲。且爬蟲將自動運行在雲端伺服器上,爬取速度更快,效率更高。

phpcrawler,php爬蟲,php採集器,多進程,多執行緒

phpQuery

相關標籤:
來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
最新問題
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板
關於我們 免責聲明 Sitemap
PHP中文網:公益線上PHP培訓,幫助PHP學習者快速成長!