社群

學習

工具庫

AI工具

休閒

繁体中文

首頁 > 後端開發 > Python教學 > 一则python3的简单爬虫代码

一则python3的简单爬虫代码

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

發布： 2016-06-06 11:30:41

原創

1779 人瀏覽過

不得不说python的上手非常简单。在网上找了一下，大都是python2的帖子，于是随手写了个python3的。代码非常简单就不解释了，直接贴代码。

代码如下:

#test rdp
import urllib.request
import re

#登录用的帐户信息
data={}
data['fromUrl']=''
data['fromUrlTemp']=''
data['loginId']='12345'
data['password']='12345'
user_agent='Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
#登录地址
#url='http://192.168.1.111:8080/loginCheck'
postdata = urllib.parse.urlencode(data)
postdata = postdata.encode('utf-8')
headers = { 'User-Agent' : user_agent }
#登录
res = urllib.request.urlopen(url,postdata)
#取得页面html
strResult=(res.read().decode('utf-8'))
#用正则表达式取出所有A标签
p = re.compile(r'(.*?)')
for m in p.finditer(strResult):
print (m.group(1))#group(1)是href里面的内容，group(2)是a标签里的文字

关于cookie、异常等处理看了一下，没有花时间去处理，毕竟只是想通过写爬虫来学习python。

相關標籤：

python 爬蟲

上一篇：从零学Python之入门（四）运算下一篇：从零学python系列之新版本导入httplib模块报ImportError解决方案

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章

如何使用LLM驅動的樣板構建自己的節點。JSAPI

2025-02-26 01:08:13
2024年編碼的LLM：價格，性能和爭取最佳的戰鬥

2025-02-26 00:46:10
提示視覺語言模型

2025-02-25 23:42:08
如何衡量大語模型的響應的可靠性

2025-02-25 22:50:13
生活的幻想

2025-02-25 21:54:11
科學家對大型語言模型的認真反映了人類思維

2025-02-25 20:45:11
通過大型語言模型來解釋新聞建議

2025-02-25 19:56:14
大語言模型課程

2025-02-25 19:45:15
語義壓縮文本以節省LLM成本

2025-02-25 19:29:11
線性關注

2025-02-25 19:10:11

最新問題

python - ubuntu16.04 lxml的報錯

來自於 1970-01-01 08:00:00

0

0

0

有辦法在PHP裡寫Python嗎？

來自於 1970-01-01 08:00:00

0

0

0

python3.x - java呼叫python，python程式碼自動停止了，找不到原因

來自於 1970-01-01 08:00:00

0

0

0

python scrapy爬蟲錯誤

來自於 1970-01-01 08:00:00

0

0

0

python相關問題求解決，有償

來自於 1970-01-01 08:00:00

0

0

0

相關專題

更多>

熱門推薦

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新ThinkPHP 5.1全球首發影片教學(60天成就PHP大牛線上訓練課程)

1434454
php入門教程之一週學會PHP

4291312
JAVA 初級入門影片教學

2638850
小甲魚零基礎入門學習Python影片教學

514998
PHP 零基礎入門教學

874521

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板