이 글에서는 주로 Python 정규 매칭, 네트워크 전송, 파일 읽기 및 쓰기 및 기타 관련 운영 기술을 포함한 헤드라인 동영상 다운로드 기능을 구현하는 Python 비디오 크롤러를 소개합니다.
이 글에서는 예제를 설명합니다. Python 비디오 크롤러의 헤드라인 비디오 기능 다운로드를 구현합니다. 참고용으로 모든 사람과 공유하세요. 세부 사항은 다음과 같습니다.
1. 수요 분석
헤드라인 짧은 동영상 캡처
아이디어:
웹 페이지 소스 코드를 분석하고, 동영상 리소스를 찾아 구문 분석합니다. URL (소스 코드 보기, mp4 검색)
URL에 대한 요청 시작 및 바이너리 데이터 반환
바이너리 데이터를 비디오 형식으로 저장
비디오 링크:
http://video.eastday.com/a/170612170956054127565 .html
2. 코드 구현
# encoding: utf-8 import sys reload(sys) sys.setdefaultencoding('utf-8') import requests import re import time time1=time.time() main_url = 'http://video.eastday.com/a/170612170956054127565.html' resp = requests.get(main_url) #没有这行,打印的结果中文是乱码 resp.encoding = 'utf-8' html = resp.text link = re.findall(r'var mp4 = "(.*?)";', html)[0] link = 'http:'+link dest_resp = requests.get(link) #视频是二进制数据流,content就是为了获取二进制数据的方法 data = dest_resp.content #保存数据的路径及文件名 path = u'C:/赵丽颖.mp4' f = open(path, 'wb') f.write(data) f.close() time2 = time.time() print u'ok,下载完成!' print u'总共耗时:' + str(time2 - time1) + 's
"D:Program FilesPython27python.exe" D:/PycharmProjects/learn2017/testwechat.py
으로 프로세스가 완료되었습니다.
ok, 다운로드 완료!
총 소요 시간: 3.204 99992371s
종료 코드 0
다운로드가 완료되었으며 재생할 수 있습니다~
관련 권장 사항:
파이썬 비디오 고속 전송 프로그램을 만드는 videocapture 라이브러리
위 내용은 Python 비디오 크롤러는 헤드라인 비디오 다운로드를 구현합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!