#免費學習推薦:python影片教學
xpath–簡單的爬蟲實例–提取陰陽師原畫壁紙
#文章目錄
很多人都玩過陰陽師吧,別的不談,陰陽師的原畫製作的那是相當地精細,閒暇之餘,用幾行簡單的程式碼爬取下來,豈不美哉?
二、需要用到的函式庫import requestsfrom lxml import etreefrom fake_useragent import UserAgentimport os
傳送門
三、實現過程1、分析網頁
」裡面的「原畫壁紙」
#進入到
頁後,選擇一個壁紙,進行檢查。
我發現,對於不同的分辨率,有不同的連結對應,而我檢查的這張圖有六個分辨率,是不是所有的圖片都是這樣呢? 後來我發現,不是!
如上所示,有個圖甚至只有四個分辨率,並且,每張圖的分辨率的位置對應還不一致,那該怎麼提取原畫鏈接呢?
A:利用xpath,根據文字內容提取節點
a = lists[i].xpath('./p/p/a[contains(text(), "1920x1080")]')[0]
這樣就能提取到解析度為「1920x1080」的a節點了。
Q:
lists[i]是什麼? A:看了完整程式碼就知道了。
2、完整程式碼實作
import requestsfrom lxml import etreefrom fake_useragent import UserAgentimport os path = 'D:/阴阳师'if not os.path.exists(path): os.mkdir(path)# 随机产生请求头ua = UserAgent(verify_ssl=False, path='fake_useragent.json')url = 'https://yys.163.com/media/picture.html' # 原画壁纸的页面链接response = requests.get(url=url).text html = etree.HTML(response)lists = html.xpath('/html/body/p[2]/p[3]/p[1]/p[3]/p[2]/p')num = 1for i in range(len(lists)): a = lists[i].xpath('./p/p/a[contains(text(), "1920x1080")]')[0] # 根据文本内容锁定节点a image_url = a.xpath('./@href')[0] # 获取原画壁纸链接 image_data = requests.get(url=image_url).content image_name = '{}.jpg'.format(num) # 给每张图片命名 save_path = path + '/' + image_name # 图片的保存地址 with open(save_path, 'wb') as f: f.write(image_data) print(image_name, '=======================>下载成功!!!') f.close() num += 1
透過合成視頻,可以慢慢欣賞爬取下來的原畫,舒服極了。
程式碼如下:
import cv2import os# 输出视频的保存路径video_dir = 'D:/yinyangshi/result.mp4'# 帧率fps = 0.2# 图片尺寸img_size = (1920, 1080)fourcc = cv2.VideoWriter_fourcc('M', 'P', '4', 'V') # opencv3.0 mp4会有警告但可以播放videoWriter = cv2.VideoWriter(video_dir, fourcc, fps, img_size)img_files = os.listdir('D:/yinyangshi/')for i in range(1, 397): img_path = 'D:/yinyangshi/tupian/' + '{}.jpg'.format(i) frame = cv2.imread(img_path) frame = cv2.resize(frame, img_size) # 生成视频 图片尺寸和设定尺寸相同 videoWriter.write(frame) # 写进视频里 print(f'======== 按照视频顺序第{i}张图片合进视频 ========')videoWriter.release() # 释放资源
陰陽師原畫集
#相關免費學習推薦:python教學(影片)#
以上是Python簡單地實作一鍵提取陰陽師原畫方法的詳細內容。更多資訊請關注PHP中文網其他相關文章!