Maison > interface Web > tutoriel HTML > le corps du texte

Pholcus 爬虫 v0.8.0,支持 HTML 风格动态规则_html/css_WEB-ITnose

WBOY
Libérer: 2016-06-21 08:59:07
original
975 Les gens l'ont consulté

近日,Pholcus 升级 v0.8.0 版本了,最大的亮点就是:终于突破规则需要静态编译的局制,增加支持HTML风格的动态规则。以后交流分享规则变得更加方便,随之而来将会是愈加完善的生态圈。

以下是具体更新内容:

一、初步支持HTML风格的动态规则

二、添加配置文件,便于修改数据库配置等信息

三、重新规划软件依赖文件目录

├─pholcus 软件

├─pholcus 依赖文件目录

│  ├─pholcus.ini 配置文件

│  │

│  ├─proxy.lib 代理IP列表库

│  │

│  ├─spider.lib 动态规则目录

│  │  └─xxx.pholcus.html 动态规则文件

│  │

│  ├─phantomjs 程序文件

│  │

│  ├─logs 日志目录

│  │

│  ├─history 历史记录目录

│  │

└─└─cache 临时缓存目录

四、增强代理IP功能

五、增强状态控制功能

六、为Spider结构体添加定时器

七、增强Request结构体序列化与反序列化的可靠性

八、Web界面的外部资源文件全部打包进软件

九、更新下载器Surfer至0.9版本,性能更佳

source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal
À propos de nous Clause de non-responsabilité Sitemap
Site Web PHP chinois:Formation PHP en ligne sur le bien-être public,Aidez les apprenants PHP à grandir rapidement!