python - 2亿++的网址,怎样快速确认网页状态码?
世界只因有你
世界只因有你 2017-05-18 10:56:14
0
5
576

用requests写了个多线程,感觉有点慢,还有其他方法么?

世界只因有你
世界只因有你

全部回复(5)
PHPzhong

使用 Tornado 的 curl 客户端支持,读到请求头就关闭连接。(我还没试过。如果它提供的 HTTP 客户端不支持中途关闭连接的话,可以像我这样使用 TCP 然后用 http-parser 来解析。)

好吧,其实你可以直接给 fetchtitle 加个取状态码的扩展就可以了……(记得装 pycurl 哦)

巴扎黑

python本来就慢,想速度快就直接写tcp请求然后读回复,读到状态后就关掉socket。

左手右手慢动作

使用grequests,对requests进行了并发封装

https://github.com/kennethrei...

迷茫

这种情况可以考虑使用gevent,tornado,scrapy-redis,asyncio!

大家讲道理

Head请求能快一点吧?

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责声明 Sitemap
PHP中文网:公益在线PHP培训,帮助PHP学习者快速成长!