php爬美女照
May 26, 2016 am 08:21 AM
php
之前看到有人用go来写了爬虫爬HD美女照,拿来用发现用不了,里面有api接口,于是拿来写了个php版本的。php只要安装了curl扩展都没问题。我拿来爬了一下,九百多张。
<?php /** * curl多线程下载类 */ class MultiHttpRequest { public $urls = array (); private $res = array (); private $curlopt_header = 0; private $method ="GET"; private $curlopt = array (); public function __construct($urls = false, $curlopt = array ()) { $this->urls = $urls; if ( !empty($curlopt) ) { $this->curlopt = $curlopt; } } public function set_urls($urls) { $this->urls = $urls; return $this; } public function set_curlopt($name, $vale) { $this->curlopt[$name] = $vale; } public function is_return_header($b) { $this->curlopt_header = $b; return $this; } public function get_curlopt() { return $this->curlopt; } public function set_method($m) { $this->medthod = strtoupper($m); return $this; } public function set_curlopts($arr) { $this->curlopt = $arr; } public function start() { if ( !is_array($this->urls) || count($this->urls) == 0 ) { return false; } $handle = curl_multi_init(); foreach ( $this->urls as $k => $v ) { $curl[$k] = $this->add_handle($handle, $v); } $this->exec_handle($handle); foreach ( $this->urls as $k => $v ) { $this->res[$k] = curl_multi_getcontent($curl[$k]); curl_multi_remove_handle($handle, $curl[$k]); } curl_multi_close($handle); } private function add_handle($handle, $url) { $curl = curl_init(); curl_setopt($curl, CURLOPT_URL, $url); foreach ( $this->curlopt as $k => $v ) { curl_setopt($curl, $k, $v); } curl_multi_add_handle($handle, $curl); return $curl; } private function exec_handle($handle) { $flag = null; do { curl_multi_exec($handle, $flag); } while ( $flag > 0 ); } public function getRes() { return $this->res; } } class HDbutifulyGril { private $url = ''; private $savepath = ''; private $imagessavepath = array(); public function __construct($url,$savepath='') { $this->url = $url; if( !empty($savepath) && !is_dir($savepath)){ mkdir($savepath,0777,true); } $this->savepath = $savepath; } /** * 得到所有大图的url地址 * @param type $id * @return array(); */ private function getimagesurl($id = '') { $url = $this->url . $id; $str = file_get_contents($url); $arr = json_decode($str, true); $images = array (); $savepath = array(); if ( is_array($arr) && !empty($arr) ) { foreach ( $arr['data'] as $v ) { $url = $v['image']['original']; $filename = $this->getFilenameBy($url); if( !file_exists($filename)){ // 如果图片已经采集了就不要再采了 $images[] = $url; $savepath[] = $filename; } } } $this->imagessavepath = $savepath; return $images; } /** * 通过url确定图片的保存地址 * @param string $url * @return string */ private function getFilenameBy($url) { $tmp = explode('/', $url); return $this->savepath . str_replace(',', '_', array_pop($tmp)); } /** * 开始下载 * @param int $id pid */ public function start($id = '') { $imgurl = $this->getimagesurl($id); $imgs = $this->MultiDownByUrls($imgurl); foreach ( $imgs as $k => $v ) { if ( !empty($v) ) { file_put_contents($this->imagessavepath[$k], $v); } } } /** * 通过urls多线程下载图片 * @param array $urls * @return array */ private function MultiDownByUrls($urls) { $opts = array ( CURLOPT_RETURNTRANSFER => 1, CURLOPT_AUTOREFERER => 1, CURLOPT_HEADER => 0, CURLOPT_FOLLOWLOCATION => 1, CURLOPT_USERAGENT => 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/33.0.1750.154 Safari/537.36' ); $mutil = new MultiHttpRequest($urls, $opts); $mutil->start(); return $mutil->getRes(); } } $url = 'http://api.lovebizhi.com/macos_v4.php?a=category&spdy=1&tid=3&order=hot&color_id=3&device=105&uuid=436e4ddc389027ba3aef863a27f6e6f9&mode=0&retina=0&client_id=1008&device_id=31547324&model_id=105&size_id=0&channel_id=70001&screen_width=1920&screen_height=1200&bizhi_width=1920&bizhi_height=1200&version_code=19&language=zh-Hans&jailbreak=0&mac=&p='; $savepath = __DIR__.DIRECTORY_SEPARATOR.'images' . DIRECTORY_SEPARATOR; $hd = new HDbutifulyGril($url,$savepath); for ( $i = 1; $i < 100; $i++ ) { $hd->start($i); }
ログイン後にコピー
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

人気の記事
レポ:チームメイトを復活させる方法
3週間前
By 尊渡假赌尊渡假赌尊渡假赌
スプリットフィクションを打ち負かすのにどれくらい時間がかかりますか?
3週間前
By DDD
R.E.P.O.説明されたエネルギー結晶と彼らが何をするか(黄色のクリスタル)
1週間前
By 尊渡假赌尊渡假赌尊渡假赌
ハローキティアイランドアドベンチャー:巨大な種を手に入れる方法
3週間前
By 尊渡假赌尊渡假赌尊渡假赌

人気の記事
レポ:チームメイトを復活させる方法
3週間前
By 尊渡假赌尊渡假赌尊渡假赌
スプリットフィクションを打ち負かすのにどれくらい時間がかかりますか?
3週間前
By DDD
R.E.P.O.説明されたエネルギー結晶と彼らが何をするか(黄色のクリスタル)
1週間前
By 尊渡假赌尊渡假赌尊渡假赌
ハローキティアイランドアドベンチャー:巨大な種を手に入れる方法
3週間前
By 尊渡假赌尊渡假赌尊渡假赌

ホットな記事タグ

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック
Gmailメールのログイン入り口はどこですか?
7288
9


Java チュートリアル
1622
14


CakePHP チュートリアル
1342
46


Laravel チュートリアル
1259
25


PHP チュートリアル
1206
29



Ubuntu および Debian 用の PHP 8.4 インストールおよびアップグレード ガイド

PHP 開発用に Visual Studio Code (VS Code) をセットアップする方法
