指定されたウェブサイトで女の子の写真をダウンロードします。ここでは、必要に応じてページ数を設定できます。
猫の値は経験に応じて変更できます。ご質問がございましたら、メッセージを残してください
2 = 巨乳の女の子
3 = 美しい脚
4 = 見た目が良い
5 = ごった煮
6 = 小さいお尻
import requests import re import time from bs4 import BeautifulSoup cat ='2' img = 'http://www.dbmeinv.com/dbgroup/show.htm?cid='+ cat end = '/dbgroup/show.htm?cid='+ cat + '&pager_offset=100' urls = [ ] def getURLs(mainURL): time.sleep(1) headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.80 Safari/537.36'} html = requests.get(mainURL).text soup = BeautifulSoup(html, 'html.parser') picURL = re.findall('<img class.*?src="(.+?\.jpg)"', html, re.S) for url in picURL: urls.append(url) print(url) asoup = soup.select('.next a')[0]['href'] Next_page = 'http://www.dbmeinv.com' + asoup if asoup != end: getURLs(Next_page) else: print('链接已处理完毕!') return urls url = getURLs(img) i = 0 for each in url: pic = requests.get(each, timeout = 10) picName = 'pictures/' + str(i) + '.jpg' fp = open(picName, 'wb') fp.write(pic.content) fp.close() i += 1 print('图片下载完成')
その他のクローラーの基本的な演習 - Pythonクローラー ダウンロード 豆板娘画像 関連記事はPHP中国語サイトにご注目ください!