抓取源码 - php有没有功能完整的网页数据采集开源项目呢

Question

请问有没有开源的工具来采集网页的数据

比如要包含连续规则抓取，例如先抓取分页信息，从中获取详情页，从详情页抓取真正需要的dom字段

包含最后自定义存到数据库，

包含可以伪造ip等

包含自动队列机制，自动延迟

等等

谢谢

PHP中文网 · Answer

有，你可以试试【神箭手云爬虫开发平台。】
神箭手云爬虫是一个帮助JS开发者快速开发爬虫系统的SaaS服务平台。神箭手提供上手简单，灵活开放的云爬虫开发框架，让开发者只需要在线写几行js代码就可以实现一个爬虫。并且爬虫将自动运行在云服务器上，爬取速度更快，效率更高。

黄舟 · Answer

phpcrawler,php爬虫,php采集器,多进程,多线程

巴扎黑 · Answer

<p>phpQuery</p>