社区

学习

工具库

AI工具

休闲

简体中文

首页 > 后端开发 > Python教程 > Python提取网页中超链接的方法

Python提取网页中超链接的方法

高洛峰

发布： 2017-02-22 16:52:18

原创

3319 人浏览过

很多人在一开始学习Python，会打算用作爬虫开发。既然要做爬虫，首先就要抓取网页，并且从网页中提取出超链接地址。这篇文章给大家分享一个简单的方法，有需要的可以参考借鉴。

下面是最简单的实现方法，先将目标网页抓回来，然后通过正则匹配a标签中的href属性来获得超链接

代码如下：

import urllib2
import re
 
url = &#39;http://www.sunbloger.com/&#39;
 
req = urllib2.Request(url)
con = urllib2.urlopen(req)
doc = con.read()
con.close()
 
links = re.findall(r&#39;href\=\"(http\:\/\/[a-zA-Z0-9\.\/]+)\"&#39;, doc)
for a in links:
  print a

登录后复制

更多Python提取网页中超链接的方法相关文章请关注PHP中文网！

相关标签：

python 网页超链接

上一篇：Python中list初始化方法示例下一篇：python解决Fedora解压zip时中文乱码的方法

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

html设置加粗、倾斜、下划线、删除线等字体效果示例介绍

1970-01-01 08:00:00
实现一个 Java 版的 Redis

1970-01-01 08:00:00
最简单的微信小程序Demo

1970-01-01 08:00:00
python中pandas.DataFrame（创建、索引、增添与删除）的简单操作方法介绍

1970-01-01 08:00:00
微信小程序：如何实现tabs选项卡效果示例

1970-01-01 08:00:00
Python构造自定义方法来美化字典结构输出

1970-01-01 08:00:00
HTML5:使用Canvas实时处理Video

1970-01-01 08:00:00
Asp.net使用SignalR实现发送图片

1970-01-01 08:00:00
微信小程序开发教程-App()和Page()函数概述

1970-01-01 08:00:00
详解python redis使用方法

1970-01-01 08:00:00

最新问题

您如何在Python中打开，阅读和写文件？

2025-03-19 14:31:30
如何在Python中创建自定义迭代器？

2025-03-19 14:29:32
如何使用PIP安装和管理软件包？

2025-03-19 14:28:24
解释Python中虚拟环境的目的。

2025-03-19 14:27:22
__name__ =='__ -main __'的目的是什么？

2025-03-19 14:25:22

相关专题

更多>

热门推荐

热门教程

更多>

相关教程

热门推荐

最新课程

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1438356
php入门教程之一周学会PHP

4299074
JAVA 初级入门视频教程

2673107
小甲鱼零基础入门学习Python视频教程

517350
PHP 零基础入门教程

878513

最新下载

更多>

网站特效

网站源码

网站素材

前端模板