目錄
采集天猫新百伦旗舰店商品数据,天猫新百伦旗舰店
首頁 php教程 php手册 采集天猫新百伦旗舰店商品数据,天猫新百伦旗舰店

采集天猫新百伦旗舰店商品数据,天猫新百伦旗舰店

Jun 13, 2016 am 09:21 AM
ht 下載 商品 地址 天貓 數據 旗艦店 蜘蛛 採集

采集天猫新百伦旗舰店商品数据,天猫新百伦旗舰店

1. 下载火蜘蛛采集器

 

 

火蜘蛛采集器下载地址:

http://firespider.duapp.com/FireSpiderWeb/index.html

 

 

 

2.安装

 

火蜘蛛采集器包含了一个客户端和一个服务端安装包。安装非常方便,一路下一步就可以安装完成。具体安装步骤可以参考它提供的安装手册。

 

3.启动

 

启动服务端:在桌面有个快捷方式“Fire Spider Server Startup”,右键-》以管理员身份运行。

启动客户端:双击桌面快捷方式“FireSpider”

 

4.试用

安装之后默认已经包含了几个采集任务了。打开客户端,如下图所示,选中一个任务后点击“执行采集”。

 

 

可以看到采集开始执行了。

 

如果需要停止采集,选中采集任务,点击“执行采集”按钮旁边的“退出”。

 

 

5.建立新百伦任务

安装之后默认已经包含了一个采集骆驼天猫店的任务——“骆驼-列表页”。我们只要参考这个,建一个自己的任务就可以了。比如我要采集 “新百伦旗舰店”,在天猫搜索“新百伦”进入新百伦天猫店,找到新百伦的列表页,链接是这样的:

 

http://newbalance.tmall.com/search.htm?spm=a220m.1000858.1000725.4.vvTbdj&rn=bda5ce8edbc3307bf802e68880861de3&user_number_id=520557274

 

接下来建一个采集新百伦的任务

 

在浏览器输出 http://localhost:8090/FireSpider/html/index.html 打开管理中心

 

 

新建一个任务,除了“任务名称”,“链接”,“数据上传链接”,其实都跟“骆驼-列表页”一样就行了。链接填写刚才的新百伦列表页的链接。

注意“数据上传链接” 字段:这个是采集器在采集到数据的时候,会把数据往这个链接以POST方式推送。因为采集器并不知道我们拿采集到的数据有什么用,只好把数据交给我们自己处理。我们可以在本地开一个REST服务,apache, tomcat, iis什么的都可以。

这里“数据上传链接” 我们填写 “http://localhost/myphp/index.php”,这里我们用的是PHP。待会会讲一个这个PHP脚本。

如果只是体验一下采集,“数据上传链接”也可以留空。

 

点击保存

 

6. 搭建WAMP

 

如果你不需要自己处理采集到的数据,这一步并不是必须的。这里讲的是PHP自定义采集数据处理,其它语言也可以略过。

6.1 安装wamp 

这个无需多言,也是一直下一步就可以了。

6.2 建立Alias 

 

输入alias名称

输入alias对应的目录

6.3 index.php脚本

 

 

[php] view plaincopy
  1.   
  2.   
  3. // 注意PHP文件要保存为UTF-8无BOM格式  
  4.   
  5.   
  6. // 取得POST过来的数据  
  7. // 因为firespider post时没有设置content type,所以要用这种方式取post数据,不能用$_POST  
  8. $content = file_get_contents("php://input");  
  9.   
  10.   
  11. // JSON解码  
  12. $p = json_decode($content);  
  13.   
  14.   
  15. // 后面可以写你自己的逻辑。这里只是保存到一个文件中  
  16. $james=fopen("e:/test/json-".$p->urlId.".txt", "w");  
  17.   
  18.   
  19. if(!$james) {  
  20.     echo'file not exist';  
  21.     exit;  
  22. }  
  23.   
  24.   
  25. fwrite($james, $content);  
  26. fclose($james);  



 

 

7. 采集新百伦

任务建立后就可以开始采集了。打开采集器客户端,在任务标签页,选中我们刚才新建的“新百伦”,点击“执行采集”

 

 

采集开始后,我们就可以在e:/test/ 下的josn-xxx.txt看到采集到的数据啦。

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
4 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
4 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
4 週前 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

超級人類(superpeople)遊戲下載安裝方法介紹 超級人類(superpeople)遊戲下載安裝方法介紹 Mar 30, 2024 pm 04:01 PM

超級人類(superpeople)遊戲可以透過steam客戶端下載遊戲,這款遊戲的大小在28G左右,下載到安裝通常需要一個半小時​​,以下為大家帶來具體的下載安裝教學!新的申請全球封閉測試方法1)在Steam商店(steam客戶端下載)搜尋“SUPERPEOPLE”2)點擊“SUPERPEOPLE”商店頁面下方的“請求SUPERPEOPLE封閉測試訪問權限”3)點擊請求訪問權限按鈕後,將在Steam庫中可確認「SUPERPEOPLECBT」遊戲4)在「SUPERPEOPLECBT」中點選安裝按鈕並下

開源!超越ZoeDepth! DepthFM:快速且精確的單目深度估計! 開源!超越ZoeDepth! DepthFM:快速且精確的單目深度估計! Apr 03, 2024 pm 12:04 PM

0.這篇文章乾了啥?提出了DepthFM:一個多功能且快速的最先進的生成式單目深度估計模型。除了傳統的深度估計任務外,DepthFM還展示了在深度修復等下游任務中的最先進能力。 DepthFM效率高,可以在少數推理步驟內合成深度圖。以下一起來閱讀這項工作~1.論文資訊標題:DepthFM:FastMonocularDepthEstimationwithFlowMatching作者:MingGui,JohannesS.Fischer,UlrichPrestel,PingchuanMa,Dmytr

Google狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理訓練最快選擇 Google狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理訓練最快選擇 Apr 01, 2024 pm 07:46 PM

谷歌力推的JAX在最近的基準測試中表現已經超過Pytorch和TensorFlow,7項指標排名第一。而且測試並不是JAX性能表現最好的TPU上完成的。雖然現在在開發者中,Pytorch依然比Tensorflow更受歡迎。但未來,也許有更多的大型模型會基於JAX平台進行訓練和運行。模型最近,Keras團隊為三個後端(TensorFlow、JAX、PyTorch)與原生PyTorch實作以及搭配TensorFlow的Keras2進行了基準測試。首先,他們為生成式和非生成式人工智慧任務選擇了一組主流

iPhone上的蜂窩數據網路速度慢:修復 iPhone上的蜂窩數據網路速度慢:修復 May 03, 2024 pm 09:01 PM

在iPhone上面臨滯後,緩慢的行動數據連線?通常,手機上蜂窩互聯網的強度取決於幾個因素,例如區域、蜂窩網絡類型、漫遊類型等。您可以採取一些措施來獲得更快、更可靠的蜂窩網路連線。修復1–強制重啟iPhone有時,強制重啟設備只會重置許多內容,包括蜂窩網路連線。步驟1–只需按一次音量調高鍵並放開即可。接下來,按降低音量鍵並再次釋放它。步驟2–過程的下一部分是按住右側的按鈕。讓iPhone完成重啟。啟用蜂窩數據並檢查網路速度。再次檢查修復2–更改資料模式雖然5G提供了更好的網路速度,但在訊號較弱

貝樂虎兒歌怎麼下載 貝樂虎兒歌怎麼下載 Mar 28, 2024 am 11:10 AM

貝樂虎兒歌作為孩子們成長過程中不可或缺的陪伴,以其歡快的旋律、生動的畫面和寓教於樂的內容,贏得了無數家長和孩子們的喜愛。為了讓寶貝們能夠隨時隨地享受到兒歌帶來的快樂,許多家長都希望能夠將貝樂虎兒歌下載到手機或平板上方便隨時拿來給孩子聽,但是究竟該如何將貝樂虎的兒歌保存到自己的手機呢,這篇教學就會為大家帶來詳細的內容介紹,還不了解的用戶們就快來跟著本文一起閱讀了解一下吧。貝樂虎兒歌下載兒歌多圖教學:開啟軟體,選擇一首想要下載的兒歌,小編這裡以「經典兒歌」為例2.在兒歌明星的下方點選「下載」按鈕,

超級智能體生命力覺醒!可自我更新的AI來了,媽媽再也不用擔心資料瓶頸難題 超級智能體生命力覺醒!可自我更新的AI來了,媽媽再也不用擔心資料瓶頸難題 Apr 29, 2024 pm 06:55 PM

哭死啊,全球狂煉大模型,一網路的資料不夠用,根本不夠用。訓練模型搞得跟《飢餓遊戲》似的,全球AI研究者,都在苦惱怎麼才能餵飽這群資料大胃王。尤其在多模態任務中,這問題尤其突出。一籌莫展之際,來自人大系的初創團隊,用自家的新模型,率先在國內把「模型生成數據自己餵自己」變成了現實。而且還是理解側和生成側雙管齊下,兩側都能產生高品質、多模態的新數據,對模型本身進行數據反哺。模型是啥?中關村論壇上剛露面的多模態大模型Awaker1.0。團隊是誰?智子引擎。由人大高瓴人工智慧學院博士生高一鑷創立,高

抖音影片如何下載儲存 抖音影片如何下載儲存 Mar 25, 2024 pm 09:46 PM

抖音影片如何下載保存?在抖音短視頻APP中是可以下載視頻保存的,多數的用戶不知道抖音如何下載視頻保存,接下來就是小編為用戶帶來的抖音視頻下載保存方法圖文教程,有興趣的用戶快來一起看看吧!抖音使用教學抖音影片如何下載儲存1、先開啟抖音短影片APP,進入主頁點選右側的【分享】按鈕功能;2、之後下方會展開多功能欄,往右側滑動找到【儲存本地】圖示;3、然後在就需要等待下載,之後會出現【已儲存,請去相簿查看】邊框;4、最後跳到相簿頁面,即可看到剛剛下載的影片儲存了。

qq下載的檔案的詳細步驟 qq下載的檔案的詳細步驟 Mar 22, 2024 pm 09:10 PM

1、首先我們開啟文件管理。 2、點擊內部儲存。 3.下滑依排序找到t開頭的Tencent(騰訊資料夾)。 4.點選進入後找到QQfile_recv,點選進入即可查看。

See all articles