社区

学习

工具库

AI工具

休闲

简体中文

首页 > 后端开发 > Python教程 > 一则python3的简单爬虫代码

一则python3的简单爬虫代码

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

发布： 2016-06-06 11:30:41

原创

1777 人浏览过

不得不说python的上手非常简单。在网上找了一下，大都是python2的帖子，于是随手写了个python3的。代码非常简单就不解释了，直接贴代码。

代码如下:

#test rdp
import urllib.request
import re

#登录用的帐户信息
data={}
data['fromUrl']=''
data['fromUrlTemp']=''
data['loginId']='12345'
data['password']='12345'
user_agent='Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
#登录地址
#url='http://192.168.1.111:8080/loginCheck'
postdata = urllib.parse.urlencode(data)
postdata = postdata.encode('utf-8')
headers = { 'User-Agent' : user_agent }
#登录
res = urllib.request.urlopen(url,postdata)
#取得页面html
strResult=(res.read().decode('utf-8'))
#用正则表达式取出所有A标签
p = re.compile(r'(.*?)')
for m in p.finditer(strResult):
print (m.group(1))#group(1)是href里面的内容，group(2)是a标签里的文字

关于cookie、异常等处理看了一下，没有花时间去处理，毕竟只是想通过写爬虫来学习python。

相关标签：

python 爬虫

上一篇：从零学Python之入门（四）运算下一篇：从零学python系列之新版本导入httplib模块报ImportError解决方案

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

如何衡量大语模型的响应的可靠性

2025-02-25 22:50:13
生活的幻想

2025-02-25 21:54:11
科学家对大型语言模型的认真反映了人类思维

2025-02-25 20:45:11
通过大型语言模型来解释新闻建议

2025-02-25 19:56:14
大语言模型课程

2025-02-25 19:45:15
语义压缩文本以节省LLM成本

2025-02-25 19:29:11
线性关注

2025-02-25 19:10:11
线性化骆驼

2025-02-25 18:38:08
Epic＆＃8220; Crossover＆＃8221;在Alphafold 3和GPT-4O之间，对蛋白质数据库条目的了解

2025-02-25 18:16:09
llms.txt解释了

2025-02-25 17:59:10

最新问题

python - ubuntu16.04 lxml的报错

来自于 1970-01-01 08:00:00

0

0

0

python3.x - java调用python，python代码自动停止了，找不到原因

来自于 1970-01-01 08:00:00

0

0

0

有办法在PHP里写Python吗？

来自于 1970-01-01 08:00:00

0

0

0

python scrapy爬虫错误

来自于 1970-01-01 08:00:00

0

0

0

python相关问题求解决，有偿

来自于 1970-01-01 08:00:00

0

0

0

相关专题

更多>

热门推荐

热门教程

更多>

相关教程

热门推荐

最新课程

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1434447
php入门教程之一周学会PHP

4291292
JAVA 初级入门视频教程

2638821
小甲鱼零基础入门学习Python视频教程

514996
PHP 零基础入门教程

874506

最新下载

更多>

网站特效

网站源码

网站素材

前端模板