社群

學習

工具庫

AI工具

休閒

繁体中文

首頁 > 後端開發 > Python教學 > Python提取網頁中超連結的方法

Python提取網頁中超連結的方法

高洛峰

發布： 2017-02-22 16:52:18

原創

3311 人瀏覽過

很多人在一開始學習Python，會打算用作爬蟲開發。既然要做爬蟲，首先就要抓取網頁，並且從網頁中提取出超連結位址。這篇文章跟大家分享一個簡單的方法，有需要的可以參考借鏡。

以下是最簡單的實作方法，先將目標網頁抓回來，然後透過正規比對a標籤中的href屬性來獲得超連結

程式碼如下：

import urllib2
import re
 
url = &#39;http://www.sunbloger.com/&#39;
 
req = urllib2.Request(url)
con = urllib2.urlopen(req)
doc = con.read()
con.close()
 
links = re.findall(r&#39;href\=\"(http\:\/\/[a-zA-Z0-9\.\/]+)\"&#39;, doc)
for a in links:
  print a

登入後複製

更多Python提取網頁中超連結的方法相關文章請關注PHP中文網！

相關標籤：

python 网页超链接

上一篇：Python中list初始化方法範例下一篇：python解決Fedora解壓縮zip時中文亂碼的方法

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章

html設定加粗、傾斜、底線、刪除線等字型效果範例介紹

1970-01-01 08:00:00
實作一個 Java 版的 Redis

1970-01-01 08:00:00
最簡單的微信小程式Demo

1970-01-01 08:00:00
python中pandas.DataFrame（建立、索引、增加與刪除）的簡單操作方法介紹

1970-01-01 08:00:00
微信小程式：如何實作tabs選項卡效果範例

1970-01-01 08:00:00
Python建構自訂方法來美化字典結構輸出

1970-01-01 08:00:00
HTML5:使用Canvas即時處理Video

1970-01-01 08:00:00
Asp.net使用SignalR實作傳送圖片

1970-01-01 08:00:00
微信小程式開發教程-App()和Page()函數概述

1970-01-01 08:00:00
詳解python redis使用方法

1970-01-01 08:00:00

最新問題

java - springboot新手學習

來自於 1970-01-01 08:00:00

0

0

0

spring - JavaWeb中 Service 層的事務問題

來自於 1970-01-01 08:00:00

0

0

0

java - wait()，notify(),notifyAll() T2 start! T2 end! T1 start! 為什麼會阻塞

來自於 1970-01-01 08:00:00

0

0

0

java - C語言演算法題-韓信點兵解法？

來自於 1970-01-01 08:00:00

0

0

0

java - 使用DDMS分析記憶體發現系統中inactive佔比重很大，這是什麼啊，有辦法對他進行GC嗎

來自於 1970-01-01 08:00:00

0

0

0

相關專題

更多>

熱門推薦

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新ThinkPHP 5.1全球首發影片教學(60天成就PHP大牛線上訓練課程)

1436921
php入門教程之一週學會PHP

4296676
JAVA 初級入門影片教學

2663483
小甲魚零基礎入門學習Python影片教學

516492
PHP 零基礎入門教學

877167

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板