社群

學習

工具庫

AI工具

休閒

繁体中文

首頁 > 後端開發 > Python教學 > 如何完整寫一個爬蟲框架

如何完整寫一個爬蟲框架

零到壹度

發布： 2018-03-30 11:28:40

原創

4888 人瀏覽過

本文主要為大家分享一篇如何完整寫一個爬蟲框架的請求方法，具有很好的參考價值，希望對大家有所幫助。一起跟著小編過來看看吧，希望能幫助大家。

產生爬蟲框架：

1、建立scrapy爬蟲工程

##2、在工程中產生一個scrapy爬蟲

3、設定spider爬蟲

4、運行爬蟲，取得網頁

具體操作：

1、建立工程

#定義一個工程，名稱為：python123demo

方法：

在cmd中，d: 進入d盤， cd pycodes 進入檔案pycodes

#然後輸入

scrapy startproject python123demo

在pycodes中會產生一個檔案：

#_init_.py不需要使用者寫

2、在工程中產生一個scrapy爬蟲

執行一條指令，給出爬蟲名字和爬取的網站

產生爬蟲：

產生一個名稱為demo 的spider

只產生demo.py,其內容為：

# #name = 'demo' 當前爬蟲名字為demo

allowed_domains = " 爬取該網站域名以下的鏈接，該域名由cmd命令台輸入

#start_urls = [] 爬取的初始頁面

parse()用於處理相應，解析內容形成字典，發現新的url爬取請求

3、配置產生的spider爬蟲，使其滿足我們的需求

#將解析的頁面儲存成檔案

修改demo.py檔

#4、執行爬蟲，取得網頁

打開cmd輸入命令列進行爬蟲

#然後我的電腦上出現了一個錯誤

windows系統上出現這個問題的解決需要安裝Py32Win模組，但直接透過官網連結裝exe會出現幾百個錯誤，更方便的做法是

####pip3 install pypiwin32 ########## ###這是py3的解決方案############注意：py3版本如果用pip install pypiwin32指令會發生錯誤###########安裝完成後，重新進行爬蟲，成功！撒花！ ##################

擷取頁面儲存在demo.html檔案中

#demo.py 所對應的完整程式碼：

兩個版本等價：

#

以上是如何完整寫一個爬蟲框架的詳細內容。更多資訊請關注PHP中文網其他相關文章！

相關標籤：

python 框架

上一篇：Python是爬取其他網頁下一篇：python操作檔方法

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章

跟我學PS第八天02：光效素材的摳圖方法

2018-08-28 15:02:42
跟我學PS第八天01：如何摳取文件中的印章

2018-08-25 10:55:46
跟我學PS第七天02：如何摳出複雜樹林

2018-08-20 16:25:41
跟我學PS第七天01：如何將彩圖摳出線稿效果

2018-08-18 11:26:54
跟我學PS第六天02：模糊工具

2018-08-14 16:35:58
跟我學PS第六天01：修復畫筆工具

2018-07-28 15:36:43
跟我學PS第五天02：移動工具的使用方法與應用

2018-07-27 16:59:00
跟我學PS第五天01：使用裁切工具

2018-07-27 15:22:47
跟我學PS第四天02：練習Photoshop中的套索工具

2018-07-23 17:56:00
跟我學PS第四天01：如何為照片加邊框效果

2018-07-23 16:21:38

最新問題

框架

來自於 1970-01-01 08:00:00

0

0

0

框架

來自於 1970-01-01 08:00:00

0

0

0

什麼框架？

來自於 1970-01-01 08:00:00

0

0

0

框架學習 - Android 介面框架！

來自於 1970-01-01 08:00:00

0

0

0

javascript - layui框架怎麼樣？

來自於 1970-01-01 08:00:00

0

0

0

相關專題

更多>

熱門推薦

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新ThinkPHP 5.1全球首發影片教學(60天成就PHP大牛線上訓練課程)

1437197
php入門教程之一週學會PHP

4296968
JAVA 初級入門影片教學

2665472
小甲魚零基礎入門學習Python影片教學

516614
PHP 零基礎入門教學

877376

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板