Blogger Information
小猿猿er
Blog
13
fans
1
comment
1
visits
18077
integral:0
P beans:30.5
  • List of blog posts
  • 使用Sanic开发快速异步响应的Web程序

    Sanic是一个类似Flask、仅仅支持Python 3.5+ 版本的web 服务器,旨在运行速度更快。在类似Flask的基础上,Sanic支持异步请求处理,也就是说,你可以使用Python 3.5 中全新而又亮眼的 async/await 语法,使...

    2019-05-07 10:58 Read 1466 comment 0
  • 使用sphinx search打造你自己的中文搜索引擎

    Google搜索引擎建立至今已经快20年了,之后全球各类大大小小类似的搜索引擎也陆续出现、消亡。

    2019-05-07 10:54 Read 2016 comment 0
  • 熟练掌握Python的内置函数,加快编程速度

    Python 2.7 的所有内置函数共有80个。熟练记住和使用这些内置函数,将大大提高写Python代码的速度和代码的优雅程度。

    2019-05-07 10:52 Read 1093 comment 0
  • Python3 基于asyncio的新闻爬虫思路

    Python写爬虫是非常方便的,爬取的目标不同,实现的方式也有很大不同。新闻爬虫的方便之处是,新闻网站几乎没有反爬虫策略,不好的地方是你想要爬取的新闻网站非常非常多。这个时候,效率就是你首要考虑的问题。

    2019-05-07 10:49 Read 1130 comment 0
  • python处理操作pdf全攻略

    花了好些时间在猿人学python上,写了一篇文章Python对pdf的各种操作​,包含pdf转word,pdf转图片,pdf翻转,加密,加水印等。

    2019-05-06 12:05 Read 991 comment 0
  • 用Python爬虫分析演唱会销售数据

    几年前我做了一个小程序,真的是小。写爬虫实时抓取淘宝,天猫等各大在线票务平台的各个演唱会销售数据,和 各种论坛讨论该演唱会门票的帖子,分析整合各个票种的售卖情况和热度,做一个可视化的票务销售情况页面,再外加一点预测功能。

    2019-05-06 11:58 Read 1672 comment 0
  • Python输出格式全总结

    有几种方法可以显示程序的输出;数据可以以人类可读的形式打印出来,或者写入文件以供将来使用。本章将讨论一些可能性。

    2019-04-19 11:05 Read 2035 comment 0
  • 现在公司写爬虫的风险有多大?还能抓吗?

    有公司抓今日头条数据,被今日头条告了 还判刑了

    2019-04-12 10:14 Read 1525 comment 0
  • 绕开登录和访问频率限制

    ​在抓某 App 时遇到要登陆和单账号,单 IP 访问控制问题,没有太多账号和 IP,就研究了他家的几个产品,找到的一个绕开限制方法。

    2019-04-02 15:14 Read 1057 comment 0
  • robots.txt快速抓取网站的小窍门

    在抓某 App 时遇到要登陆和单账号,单 IP 访问控制问题,没有太多账号和 IP,就研究了他家的几个产品,找到的一个绕开限制方法。

    2019-04-02 15:14 Read 1069 comment 0
  • 我用python挣钱的那点事儿

    在下写了10年Python,期间写了各种奇葩爬虫,挣各种奇葩的钱,写这篇文章总结下几种爬虫挣钱的方式。

    2019-04-12 10:32 Read 1519 comment 1
  • Python知识点:理解和使用装饰器 @decorator

    Python的装饰器(decorator)是一个很棒的机制,也是熟练运用Python的必杀技之一。

    2019-03-18 12:00 Read 1373 comment 0
  • Python爬虫使用浏览器的cookies:browsercookie

    很多用Python的人可能都写过网络爬虫,自动化获取网络数据确实是一件令人愉悦的事情,而Python很好的帮助我们达到这种愉悦。然而,爬虫经常要碰到各种登录、验证的阻挠,让人灰心丧气(网站:天天碰到各种各样的爬虫抓我们网站,也很让人灰心丧气~)。爬虫...

    2019-03-15 17:23 Read 1220 comment 0