. adalah bahan yang sangat baik untuk semua orang, dan ia juga sangat praktikal untuk beberapa rakan copywriting ilustrasi. Ia juga berfungsi dengan baik sebagai kertas dinding. Kod fungsi yang sepadan telah dibungkus ke dalam alat exe, saya harap ia akan membantu anda
Selepas beberapa operasi, saya mendapati bahawa apabila menarik ke bawah, halaman web akan mengeluarkan permintaan berikut dan anda boleh melihat gambar
Jumlah bilangan: 10000, jumlah bilangan halaman: 500Mari keluarkan beberapa URL dan lihat:
Pautan di atas hanya mempunyai berbeza parameter halaman, dan parameter halaman yang semakin mesra yang semakin meningkat . Apabila meminta, mereka teratur. . panjang Tepat sekali 20, Dengan nilai per_page yang sama dalam permintaan, tidak syak lagi bahawa pautan ke setiap imej yang kami cari ada di sini.
Menganalisis halaman web selalunya memakan masa, tetapi secara keseluruhannya kini kami merangkak imej secara rasmi.
import time import random import json import requests from fake_useragent import UserAgent
fake_useragent:代理
ua = UserAgent(verify_ssl=False) headers = {'User-Agent': ua.random}
def getpicurls(i,headers): picurls = [] url = 'https://unsplash.com/napi/search/photos?query=nature&per_page=20&page={}&xp=feedback-loop-v2%3Aexperiment'.format(i) r = requests.get(url, headers=headers, timeout=5) time.sleep(random.uniform(3.1, 4.5)) r.raise_for_status() r.encoding = r.apparent_encoding allinfo = json.loads(r.text) results = allinfo['results'] for result in results: href = result['urls']['full'] picurls.append(href) return picurls
def getpic(count,url): r = requests.get(url, headers=headers, timeout=5) with open('pictures/{}.jpg'.format(count), 'wb') as f: f.write(r.content)
Cuba untuk tidak merangkak dengan kerap untuk mengelakkan menjejaskan susunan rangkaian!
Gambar adalah gambar definisi tinggi dari Internet Kelajuan merangkak adalah berkaitan dengan rangkaian dan secara amnya tidak terlalu pantas.
Anda boleh membina kumpulan proksi untuk merangkak dengan lebih pantas.
Atas ialah kandungan terperinci Crawler |. Muat turun kumpulan kertas dinding HD (kod sumber + alatan disertakan). Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!