目录
采集天猫新百伦旗舰店商品数据,天猫新百伦旗舰店
首页 php教程 php手册 采集天猫新百伦旗舰店商品数据,天猫新百伦旗舰店

采集天猫新百伦旗舰店商品数据,天猫新百伦旗舰店

Jun 13, 2016 am 09:21 AM
ht 下载 商品 地址 天猫 数据 旗舰店 蜘蛛 采集

采集天猫新百伦旗舰店商品数据,天猫新百伦旗舰店

1. 下载火蜘蛛采集器

 

 

火蜘蛛采集器下载地址:

http://firespider.duapp.com/FireSpiderWeb/index.html

 

 

 

2.安装

 

火蜘蛛采集器包含了一个客户端和一个服务端安装包。安装非常方便,一路下一步就可以安装完成。具体安装步骤可以参考它提供的安装手册。

 

3.启动

 

启动服务端:在桌面有个快捷方式“Fire Spider Server Startup”,右键-》以管理员身份运行。

启动客户端:双击桌面快捷方式“FireSpider”

 

4.试用

安装之后默认已经包含了几个采集任务了。打开客户端,如下图所示,选中一个任务后点击“执行采集”。

 

 

可以看到采集开始执行了。

 

如果需要停止采集,选中采集任务,点击“执行采集”按钮旁边的“退出”。

 

 

5.建立新百伦任务

安装之后默认已经包含了一个采集骆驼天猫店的任务——“骆驼-列表页”。我们只要参考这个,建一个自己的任务就可以了。比如我要采集 “新百伦旗舰店”,在天猫搜索“新百伦”进入新百伦天猫店,找到新百伦的列表页,链接是这样的:

 

http://newbalance.tmall.com/search.htm?spm=a220m.1000858.1000725.4.vvTbdj&rn=bda5ce8edbc3307bf802e68880861de3&user_number_id=520557274

 

接下来建一个采集新百伦的任务

 

在浏览器输出 http://localhost:8090/FireSpider/html/index.html 打开管理中心

 

 

新建一个任务,除了“任务名称”,“链接”,“数据上传链接”,其实都跟“骆驼-列表页”一样就行了。链接填写刚才的新百伦列表页的链接。

注意“数据上传链接” 字段:这个是采集器在采集到数据的时候,会把数据往这个链接以POST方式推送。因为采集器并不知道我们拿采集到的数据有什么用,只好把数据交给我们自己处理。我们可以在本地开一个REST服务,apache, tomcat, iis什么的都可以。

这里“数据上传链接” 我们填写 “http://localhost/myphp/index.php”,这里我们用的是PHP。待会会讲一个这个PHP脚本。

如果只是体验一下采集,“数据上传链接”也可以留空。

 

点击保存

 

6. 搭建WAMP

 

如果你不需要自己处理采集到的数据,这一步并不是必须的。这里讲的是PHP自定义采集数据处理,其它语言也可以略过。

6.1 安装wamp 

这个无需多言,也是一直下一步就可以了。

6.2 建立Alias 

 

输入alias名称

输入alias对应的目录

6.3 index.php脚本

 

 

[php] view plaincopy
  1.   
  2.   
  3. // 注意PHP文件要保存为UTF-8无BOM格式  
  4.   
  5.   
  6. // 取得POST过来的数据  
  7. // 因为firespider post时没有设置content type,所以要用这种方式取post数据,不能用$_POST  
  8. $content = file_get_contents("php://input");  
  9.   
  10.   
  11. // JSON解码  
  12. $p = json_decode($content);  
  13.   
  14.   
  15. // 后面可以写你自己的逻辑。这里只是保存到一个文件中  
  16. $james=fopen("e:/test/json-".$p->urlId.".txt", "w");  
  17.   
  18.   
  19. if(!$james) {  
  20.     echo'file not exist';  
  21.     exit;  
  22. }  
  23.   
  24.   
  25. fwrite($james, $content);  
  26. fclose($james);  



 

 

7. 采集新百伦

任务建立后就可以开始采集了。打开采集器客户端,在任务标签页,选中我们刚才新建的“新百伦”,点击“执行采集”

 

 

采集开始后,我们就可以在e:/test/ 下的josn-xxx.txt看到采集到的数据啦。

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解锁Myrise中的所有内容
4 周前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

超级人类(superpeople)游戏下载安装方法介绍 超级人类(superpeople)游戏下载安装方法介绍 Mar 30, 2024 pm 04:01 PM

超级人类(superpeople)游戏可以通过steam客户端下载游戏,这款游戏的大小在28G左右,下载到安装通常需要一个半小时,下面为大家带来具体的下载安装教程!新的申请全球封闭测试方法1)在Steam商店(steam客户端下载)搜索“SUPERPEOPLE”2)点击“SUPERPEOPLE”商店页面下方的“请求SUPERPEOPLE封闭测试访问权限”3)点击请求访问权限按钮后,将在Steam库中可确认“SUPERPEOPLECBT”游戏4)在“SUPERPEOPLECBT”中点击安装按钮并下

开源!超越ZoeDepth! DepthFM:快速且精确的单目深度估计! 开源!超越ZoeDepth! DepthFM:快速且精确的单目深度估计! Apr 03, 2024 pm 12:04 PM

0.这篇文章干了啥?提出了DepthFM:一个多功能且快速的最先进的生成式单目深度估计模型。除了传统的深度估计任务外,DepthFM还展示了在深度修复等下游任务中的最先进能力。DepthFM效率高,可以在少数推理步骤内合成深度图。下面一起来阅读一下这项工作~1.论文信息标题:DepthFM:FastMonocularDepthEstimationwithFlowMatching作者:MingGui,JohannesS.Fischer,UlrichPrestel,PingchuanMa,Dmytr

谷歌狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理训练最快选择 谷歌狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理训练最快选择 Apr 01, 2024 pm 07:46 PM

谷歌力推的JAX在最近的基准测试中性能已经超过Pytorch和TensorFlow,7项指标排名第一。而且测试并不是在JAX性能表现最好的TPU上完成的。虽然现在在开发者中,Pytorch依然比Tensorflow更受欢迎。但未来,也许有更多的大模型会基于JAX平台进行训练和运行。模型最近,Keras团队为三个后端(TensorFlow、JAX、PyTorch)与原生PyTorch实现以及搭配TensorFlow的Keras2进行了基准测试。首先,他们为生成式和非生成式人工智能任务选择了一组主流

iPhone上的蜂窝数据互联网速度慢:修复 iPhone上的蜂窝数据互联网速度慢:修复 May 03, 2024 pm 09:01 PM

在iPhone上面临滞后,缓慢的移动数据连接?通常,手机上蜂窝互联网的强度取决于几个因素,例如区域、蜂窝网络类型、漫游类型等。您可以采取一些措施来获得更快、更可靠的蜂窝互联网连接。修复1–强制重启iPhone有时,强制重启设备只会重置许多内容,包括蜂窝网络连接。步骤1–只需按一次音量调高键并松开即可。接下来,按降低音量键并再次释放它。步骤2–该过程的下一部分是按住右侧的按钮。让iPhone完成重启。启用蜂窝数据并检查网络速度。再次检查修复2–更改数据模式虽然5G提供了更好的网络速度,但在信号较弱

贝乐虎儿歌怎么下载 贝乐虎儿歌怎么下载 Mar 28, 2024 am 11:10 AM

贝乐虎儿歌作为孩子们成长过程中不可或缺的陪伴,以其欢快的旋律、生动的画面和寓教于乐的内容,赢得了无数家长和孩子们的喜爱。为了让宝贝们能够随时随地享受到儿歌带来的快乐,许多家长都希望能够将贝乐虎儿歌下载到手机或平板上方便随时拿来给孩子听,但是究竟该如何将贝乐虎的儿歌保存到自己的手机上呢,这篇教程就将为大家带来详细的内容介绍,还不了解的用户们就快来跟着本文一起阅读了解一下吧。贝乐虎儿歌下载儿歌多图教程:打开软件,选择一首想要下载的儿歌,小编这里以“经典儿歌”为例2.在儿歌明星的下方点击“下载”按钮,

抖音视频如何下载保存 抖音视频如何下载保存 Mar 25, 2024 pm 09:46 PM

抖音视频如何下载保存?在抖音短视频APP中是可以下载视频保存的,多数的用户不知道抖音如何下载视频保存,接下来就是小编为用户带来的抖音视频下载保存方法图文教程,感兴趣的用户快来一起看看吧!抖音使用教程抖音视频如何下载保存1、首先打开抖音短视频APP,进入到主页面点击右侧的【分享】按钮功能;2、之后下方会展开多功能栏,往右侧滑动找到【保存本地】图标;3、然后在就需要等待下载,之后会出现【已保存,请去相册查看】边框;4、最后跳转到相册页面,即可看到刚刚下载的视频保存了。

超级智能体生命力觉醒!可自我更新的AI来了,妈妈再也不用担心数据瓶颈难题 超级智能体生命力觉醒!可自我更新的AI来了,妈妈再也不用担心数据瓶颈难题 Apr 29, 2024 pm 06:55 PM

哭死啊,全球狂炼大模型,一互联网的数据不够用,根本不够用。训练模型搞得跟《饥饿游戏》似的,全球AI研究者,都在苦恼怎么才能喂饱这群数据大胃王。尤其在多模态任务中,这一问题尤为突出。一筹莫展之际,来自人大系的初创团队,用自家的新模型,率先在国内把“模型生成数据自己喂自己”变成了现实。而且还是理解侧和生成侧双管齐下,两侧都能生成高质量、多模态的新数据,对模型本身进行数据反哺。模型是啥?中关村论坛上刚刚露面的多模态大模型Awaker1.0。团队是谁?智子引擎。由人大高瓴人工智能学院博士生高一钊创立,高

qq下载的文件的详细步骤 qq下载的文件的详细步骤 Mar 22, 2024 pm 09:10 PM

1、首先我们打开文件管理。2、点击内部存储。3、下滑按排序找到t开头的Tencent(腾讯文件夹)。4、点击进入后找到QQfile_recv,点击进入即可查看。

See all articles