网页爬虫 - python爬虫案例
ringa_lee
ringa_lee 2017-04-17 17:50:11
0
1
1136

请问大家能不能给我一点提点,我想要知道有没有 简单 一点的 爬虫 案例可以让我摸索学习


目前已知的爬虫工具有:

  1. Beautiful Soup

  2. Scrapy

  3. cola

  4. pyspider

  5. PyQuery

  6. grab

ringa_lee
ringa_lee

ringa_lee

全部回复(1)
Ty80

你如果真的没有概念,以下有一些资讯给你参考,不过重点还是你要去看...

首先是什么是 网路爬虫(web crawler):

  1. 可以简单的先看一下 wiki-网路爬虫

  2. 再来这个网站: 大数学堂 有一些简单的教学(还有影片),相信是非常适合初学者的,你可以从 什么是网路爬虫 这篇开始

接着是 入门教学:

  1. 其实有个很简单的方法,挑一个爬虫工具去读文档就好,如果你没什么方向,你可以选择看看Beautiful Soup 中文文档,他是中文版的,也不算太复杂,花点时间就可以整个看完。

  2. 刚刚 大数学堂 有一系列的入门教学 和 实战教学,我觉得应该也是值得参考的,下面列出入门课程的前几篇:

    1. 开始使用Python撰写网路爬虫 ( Crawler )

    2. 如何安装 Jupyter (Ipython Notebook)

    3. Jupyter 操作入门 (1)

    4. 如何使用GET 抓取网页内容?

    5. 如何使用POST 抓取网页内容?

    6. 如何使用Python 套件: BeautifulSoup4 剖析网页内容?

    7. 如何使用Python 的requests 及BeautifulSoup4 完成淘宝爬虫?

再来是了解有那些 工具爬虫框架:

  1. 这个地方整理得很完整: Python 爬虫的工具列表附Github代码下载链接

  2. 这个 blog 也有满多教学的

关于爬虫工具和框架的讨论可以参考这篇 知乎: 用Python写爬虫,用什么方式、框架比较好?


我觉得网路上的资源很多,你都可以试试看,万事起头难,加油啰!

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责声明 Sitemap
PHP中文网:公益在线PHP培训,帮助PHP学习者快速成长!