masyarakat

Belajar

Perpustakaan Alatan

Alat AI

Masa lapang

Melayu

Rumah > pembangunan bahagian belakang > Tutorial Python > python爬虫入门教程之点点美女图片爬虫代码分享

python爬虫入门教程之点点美女图片爬虫代码分享

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Lepaskan： 2016-06-16 08:42:14

asal

1413 orang telah melayarinya

继续鼓捣爬虫，今天贴出一个代码，爬取点点网「美女」标签下的图片，原图。

# -*- coding: utf-8 -*- 

#--------------------------------------- 
#  程序：点点美女图片爬虫 
#  版本：0.2 
#  作者：zippera 
#  日期：2013-07-26 
#  语言：Python 2.7 
#  说明：能设置下载的页数 
#--------------------------------------- 
 
import urllib2
import urllib
import re
 
 
 
pat = re.compile('<div class="feed-big-img">\n.*&#63;imgsrc="(ht.*&#63;)\".*&#63;')
nexturl1 = "http://www.diandian.com/tag/%E7%BE%8E%E5%A5%B3&#63;page="
 
 
count = 1
 
while count < 2:
 
  print "Page " + str(count) + "\n"
  myurl = nexturl1 + str(count)
  myres = urllib2.urlopen(myurl)
  mypage = myres.read()
  ucpage = mypage.decode("utf-8") #转码
 
  mat = pat.findall(ucpage)
  
 
  
  
  
  if len(mat):
    cnt = 1
    for item in mat:
      print "Page" + str(count) + " No." + str(cnt) + " url: " + item + "\n"
      cnt += 1
      fnp = re.compile('(\w{10}\.\w+)$')
      fnr = fnp.findall(item)
      if fnr:
        fname = fnr[0]
        urllib.urlretrieve(item, fname)
    
  else:
    print "no data"
    
  count += 1

Salin selepas log masuk

使用方法：新建一个文件夹，把代码保存为name.py文件，运行python name.py就可以把图片下载到文件夹。

Label berkaitan：

python

Artikel sebelumnya：Python中函数的用法实例教程 Artikel seterusnya：Python Tkinter基础控件用法

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel terbaru oleh pengarang

Bagaimana LLMS Berfungsi: Pra-latihan ke Latihan Pasca, Rangkaian Neural, Hallucinations, dan Kesimpulan

2025-02-26 03:58:14
Saya menggabungkan blockchain dan AI untuk menjana seni. Di sini ’ s Apa yang berlaku seterusnya.

2025-02-26 03:38:10
Kejuruteraan Prompt Lanjutan: Rantai Pemikiran (COT)

2025-02-26 03:17:10
Pengambilan semula Generasi Tambahan di SQLite

2025-02-26 02:49:09
Cara menggunakan boilerplate berkuasa LLM untuk membina API Node.js anda sendiri

2025-02-26 01:08:13
LLMS untuk pengekodan pada tahun 2024: harga, prestasi, dan pertempuran untuk yang terbaik

2025-02-26 00:46:10
Mendorong model bahasa penglihatan

2025-02-25 23:42:08
Cara Mengukur Kebolehpercayaan Respons Model Bahasa Besar

2025-02-25 22:50:13
Ilusi hidup

2025-02-25 21:54:11
Para saintis serius mengenai model bahasa besar yang mencerminkan pemikiran manusia

2025-02-25 20:45:11

Isu terkini

Bagaimana anda boleh mengoptimumkan pertanyaan pangkalan data di Python?

2025-03-26 16:39:41
Terangkan konsep pergudangan data. Apakah skema bintang dan skema salji?

2025-03-26 16:38:35
Apakah pelbagai jenis gabungan dalam SQL? Bagaimana anda boleh melakukan gabungan menggunakan panda?

2025-03-26 16:37:42
Huraikan proses ETL (ekstrak, transformasi, beban). Bagaimana anda boleh melaksanakan saluran paip ETL di Python?

2025-03-26 16:36:43
Bagaimanakah anda boleh menggunakan panda untuk membersihkan, mengubah, dan menganalisis data dalam python?

2025-03-26 16:35:41

Topik-topik yang berkaitan

Lagi>

Cadangan popular

Tutorial Popular

Lagi>

Tutorial berkaitan

Cadangan popular

Kursus terkini

Muat turun terkini

Lagi>

kesan web

Kod sumber laman web

Bahan laman web

Templat hujung hadapan