Heim > php教程 > php手册 > php多线程thread开发与应用的例子

php多线程thread开发与应用的例子

WBOY
Freigeben: 2016-05-25 16:45:20
Original
1190 Leute haben es durchsucht

php多线程的使用,首先需要PHP5.3以上版本,并安装pthreads PHP扩展,可以使PHP真正的支持多线程,扩展如何安装请自行百度.

PHP扩展下载:https://github.com/krakjoe/pthreads

PHP手册文档:http://php.net/manual/zh/book.pthreads.php

在安装好扩展之后,就可以运用多线程了,下面贴个通过搜索结果抓取百度网盘内容的代码:

<?php
include &#39;include/CurlLoad.class.php&#39;; // 引入读取库
/** 
 * 多线程抓取内容
 * @param array $url 待抓取URL列表集合
 * @return 成功返回指定内容,失败返回NULL
 */
function vget($url) {
    $ret = BaiduSRLinksGet($url, 1); // 获取结果列表地址
    if ($ret != null) {
        if (array_key_exists("links", $ret)) {
            $infos = array();
            $number = count($ret[&#39;links&#39;]);
            for ($i = 0; $i < $number; $i++) { //循环创建线程对象
                $thread_array[$i] = new baidu_thread_run($ret[&#39;links&#39;][$i]);
                $thread_array[$i]->start();
            }
            foreach ($thread_array as $thread_array_key => $thread_array_value) { //检查线程是否执行结束
                while ($thread_array[$thread_array_key]->isRunning()) {
                    usleep(10);
                }
                if ($thread_array[$thread_array_key]->join()) { //如果执行结束,取出结果
                    $temp = $thread_array[$thread_array_key]->data;
                    if ($temp != null) $infos[&#39;res&#39;][] = $temp;
                }
            }
            $infos[&#39;pages&#39;] = $ret[&#39;pages&#39;];
            $infos[&#39;status&#39;] = "1";
        } else $infos = null;
    } else $infos = null;
    return $infos;
}
/** 
 * 获取百度搜索结果列表URL
 *
 * @param string $url
 *         搜索结果页URL
 * @param int $format
 *         默认$format=0,获取默认地址;$format=1获取跳转后真实地址
 * @return NULL multitype:array()
 */
function BaiduSRLinksGet($url, $format = 0) {
    $html = CurlLoad::HtmlGet($url); // 获取页面
    if ($html == null) return null;
    try {
        preg_match_all("/"url":"( ? < links > . *) "}/", $html, $rets); // 搜索结果链接筛选
        if (!array_key_exists(&#39;links&#39;, $rets)) // 如果数组中不包含Links键名,表示获取失败
        return null;
        $ret = array();
        if ($format == 1) {
            $number = count($rets[&#39;links&#39;]);
            for ($i = 0; $i < $number; $i++) {
                $headr_temp = CurlLoad::Get_Headers($rets[&#39;links&#39;][$i], 1); // 通过headr获取真实地址
                if (array_key_exists("Location", $headr_temp)) $ret[&#39;links&#39;][$i] = $headr_temp[&#39;Location&#39;];
                else $ret[&#39;links&#39;] = $rets[&#39;links&#39;];
            }
        } else $ret[&#39;links&#39;] = $rets[&#39;links&#39;];
        preg_match_all(&#39;/href="?/s?wd=site%3Apan.baidu.com%20(?<url>.+?)&ie=utf-8">/&#39;, $html, $out);
        unset($out[&#39;url&#39;][0]);
        $number = count($out[&#39;url&#39;]);
        for ($i = 1; $i < $number; $i++) {
            preg_match_all(&#39;/&pn=(.*)/&#39;, $out[&#39;url&#39;][$i], $temp);
            $ret[&#39;pages&#39;][$temp[1][0] / 10] = base64_encode($out[&#39;url&#39;][$i]);
        }
        return $ret;
    }
    catch(Exception $e) {
        WriteLog($e);
        return null;
    }
}
/** 
 * 百度网盘资源信息获取
 *
 * @param string $url
 *         网盘资源页URL
 * @return NULL array
 */
function PanInfoGet($url) {
    $html = CurlLoad::HtmlGet($url); // 获取页面
    if ($html == null) return null;
    try {
        if (preg_match_all("/文件名:(?<name>.*) 文件大小:(?<size>.*) 分享者:(?<user>.*) 分享时间:(?<date>.*) 下载次数:(?<number>[0-9]+)/", $html, $ret) == 0) return null;
        $rets[&#39;name&#39;] = $ret[&#39;name&#39;][0];
        $rets[&#39;size&#39;] = $ret[&#39;size&#39;][0];
        $rets[&#39;user&#39;] = $ret[&#39;user&#39;][0];
        $rets[&#39;date&#39;] = $ret[&#39;date&#39;][0];
        $rets[&#39;number&#39;] = $ret[&#39;number&#39;][0];
        $rets[&#39;link&#39;] = $url;
        return $rets;
    }
    catch(Exception $e) {
        WriteLog($e);
        return null;
    }
}
function WriteLog($str) {
    $file = fopen("../error.log", "a+");
    fwrite($file, "Warning:" . date("Y/m/d H:i:s") . ":" . $str . "rn");
    fclose($file);
}
/** 
 * 多线程抓取对象
 * @author MuXi
 *
 */
class baidu_thread_run extends Thread {
    public $url;
    public $data;
    public function __construct($url) {
        $this->url = $url;
    }
    public function run() {
        if (($url = $this->url)) {
            $this->data = PanInfoGet($url); //线程执行方法
            
        }
    }
}
?>
Nach dem Login kopieren


Verwandte Etiketten:
Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Empfehlungen
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage