84669 Lernen von Personen
152542 Lernen von Personen
20005 Lernen von Personen
5487 Lernen von Personen
7821 Lernen von Personen
359900 Lernen von Personen
3350 Lernen von Personen
180660 Lernen von Personen
48569 Lernen von Personen
18603 Lernen von Personen
40936 Lernen von Personen
1549 Lernen von Personen
1183 Lernen von Personen
32909 Lernen von Personen
请问大家能不能给我一点提点,我想要知道有没有 简单 一点的 爬虫 案例可以让我摸索学习
目前已知的爬虫工具有:
Beautiful Soup
Scrapy
cola
pyspider
PyQuery
grab
ringa_lee
你如果真的沒有概念,以下有一些資訊給你參考,不過重點還是你要去看...
首先是甚麼是 網路爬蟲(web crawler):
可以簡單的先看一下 wiki-網路爬蟲
再來這個網站: 大數學堂 有一些簡單的教學(還有影片),相信是非常適合初學者的,你可以從 什麼是網路爬蟲 這篇開始
接著是 入門教學:
其實有個很簡單的方法,挑一個爬蟲工具去讀文檔就好,如果你沒甚麼方向,你可以選擇看看 Beautiful Soup 中文文檔,他是中文版的,也不算太複雜,花點時間就可以整個看完。
剛剛 大數學堂 有一系列的入門教學 和 實戰教學,我覺得應該也是值得參考的,下面列出入門課程的前幾篇:
開始使用Python撰寫網路爬蟲 ( Crawler )
如何安裝 Jupyter (Ipython Notebook)
Jupyter 操作入門 (1)
如何使用GET 抓取網頁內容?
如何使用POST 抓取網頁內容?
如何使用Python 套件: BeautifulSoup4 剖析網頁內容?
如何使用Python 的requests 及BeautifulSoup4 完成淘寶爬蟲?
再來是了解有那些 工具 和 爬蟲框架:
這個地方整理得很完整: Python 爬蟲的工具列表附Github代碼下載鏈接
這個 blog 也有滿多教學的
關於爬蟲工具和框架的討論可以參考這篇 知乎: 用Python写爬虫,用什么方式、框架比较好?
我覺得網路上的資源很多,你都可以試試看,萬事起頭難,加油囉!
你如果真的沒有概念,以下有一些資訊給你參考,不過重點還是你要去看...
首先是甚麼是 網路爬蟲(web crawler):
可以簡單的先看一下 wiki-網路爬蟲
再來這個網站: 大數學堂 有一些簡單的教學(還有影片),相信是非常適合初學者的,你可以從 什麼是網路爬蟲 這篇開始
接著是 入門教學:
其實有個很簡單的方法,挑一個爬蟲工具去讀文檔就好,如果你沒甚麼方向,你可以選擇看看 Beautiful Soup 中文文檔,他是中文版的,也不算太複雜,花點時間就可以整個看完。
剛剛 大數學堂 有一系列的入門教學 和 實戰教學,我覺得應該也是值得參考的,下面列出入門課程的前幾篇:
開始使用Python撰寫網路爬蟲 ( Crawler )
如何安裝 Jupyter (Ipython Notebook)
Jupyter 操作入門 (1)
如何使用GET 抓取網頁內容?
如何使用POST 抓取網頁內容?
如何使用Python 套件: BeautifulSoup4 剖析網頁內容?
如何使用Python 的requests 及BeautifulSoup4 完成淘寶爬蟲?
再來是了解有那些 工具 和 爬蟲框架:
這個地方整理得很完整: Python 爬蟲的工具列表附Github代碼下載鏈接
這個 blog 也有滿多教學的
關於爬蟲工具和框架的討論可以參考這篇 知乎: 用Python写爬虫,用什么方式、框架比较好?
我覺得網路上的資源很多,你都可以試試看,萬事起頭難,加油囉!