這篇文章主要介紹了Python視頻爬蟲實現下載頭條視頻功能,涉及Python正則匹配、網絡傳輸及文件讀寫等相關操作技巧,需要的朋友可以參考下
本文實例講述了Python影片爬蟲實現下載頭條影片功能。分享給大家供大家參考,具體如下:
一、需求分析
#抓取頭條短片
##想法:
分析網頁原始碼,找出解析出視訊資源url(檢視原始程式碼,搜尋mp4)對該url發起請求,返回二進位資料
將二進位資料儲存為視訊格式
影片連結:
http://video.eastday.com/a/170612170956054127565.html
##2、程式碼實作
# encoding: utf-8 import sys reload(sys) sys.setdefaultencoding('utf-8') import requests import re import time time1=time.time() main_url = 'http://video.eastday.com/a/170612170956054127565.html' resp = requests.get(main_url) #没有这行,打印的结果中文是乱码 resp.encoding = 'utf-8' html = resp.text link = re.findall(r'var mp4 = "(.*?)";', html)[0] link = 'http:'+link dest_resp = requests.get(link) #视频是二进制数据流,content就是为了获取二进制数据的方法 data = dest_resp.content #保存数据的路径及文件名 path = u'C:/赵丽颖.mp4' f = open(path, 'wb') f.write(data) f.close() time2 = time.time() print u'ok,下载完成!' print u'总共耗时:' + str(time2 - time1) + 's
"D:\Program Files\Python27\python.exe" D:/PycharmProjects/learn2017/testwechat.py成功下載可以播放~ 相關推薦:ok,下載完成!
總共耗時:3.20499992371s
Process finished with exit code 0
以上是Python視頻爬蟲實現下載頭條視頻的詳細內容。更多資訊請關注PHP中文網其他相關文章!