社区

学习

工具库

AI工具

休闲

简体中文

首页 > 后端开发 > Python教程 > python爬虫教程之爬取百度贴吧并下载的示例

python爬虫教程之爬取百度贴吧并下载的示例

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

发布： 2016-06-06 11:29:45

原创

1604 人浏览过

测试url：http://tieba.baidu.com/p/27141123322?pn=
begin 1
end 4

代码如下:

import string ,urllib2

def baidu_tieba(url,begin_page,end_page):
    for i in range(begin_page, end_page+1):
        sName = string.zfill(i,5)+ '.html'
        print '正在下载第' + str(i) + '个网页，并将其存储为' + sName + '..........'
        f = open (sName,'w+')
        m = urllib2.urlopen(url + str(i)).read()
        f.write(m)
        f.close()

bdurl = str(raw_input('url： \n'))
begin_page = int(raw_input('begin :\n'))
end_page = int(raw_input('end : \n'))

baidu_tieba(bdurl,begin_page,end_page)

相关标签：

下载百度贴吧

上一篇：pyqt4教程之widget使用示例分享下一篇：python读取csv文件示例(python操作csv)

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

LLM的工作方式：培训前训练，神经网络，幻觉和推理

2025-02-26 03:58:14
我将区块链和AI组合在一起以生成艺术。接下来发生了什么。

2025-02-26 03:38:10
高级及时工程：思想链（COT）

2025-02-26 03:17:10
在Sqlite中检索增强发电

2025-02-26 02:49:09
如何使用LLM驱动的样板构建自己的节点。JSAPI

2025-02-26 01:08:13
2024年编码的LLM：价格，性能和争取最佳的战斗

2025-02-26 00:46:10
提示视觉语言模型

2025-02-25 23:42:08
如何衡量大语模型的响应的可靠性

2025-02-25 22:50:13
生活的幻想

2025-02-25 21:54:11
科学家对大型语言模型的认真反映了人类思维

2025-02-25 20:45:11

最新问题

网页爬虫 - Python爬虫入门知识

来自于 1970-01-01 08:00:00

0

0

0

网页爬虫 - Python requests.get 爬虫设置代理 IP地址未改变

来自于 1970-01-01 08:00:00

0

0

0

redis - 行python爬虫时，MySQL版本是5.7，总是报错

来自于 1970-01-01 08:00:00

0

0

0

网页爬虫 - python requests爬虫问题

来自于 1970-01-01 08:00:00

0

0

0

selenium - 请教一下 Python 爬虫工具

来自于 1970-01-01 08:00:00

0

0

0

相关专题

更多>

热门推荐

热门教程

更多>

相关教程

热门推荐

最新课程

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1437233
php入门教程之一周学会PHP

4297148
JAVA 初级入门视频教程

2666188
小甲鱼零基础入门学习Python视频教程

516656
PHP 零基础入门教程

877530

最新下载

更多>

网站特效

网站源码

网站素材

前端模板