php中curl_multi函数集的用法
一、引言
这段时间比较忙,已经很久没有写博客了。今天我就来聊聊我关于curl_multi_*函数集的使用心得,关于http请求的问题。
当我们用户php发起一个http请求的时候。我们会首先想到用什么?没错,我们会创建curl来请求。当我们在一次执行中需要发起多个http请求呢。这简单,对每一个URL发起一次url请求。请求玩第1个再请求第2个….这就完了?哪我们还说个啥。
官网链接:http://php.net/manual/zh/book.curl.php
二、多次简单的curl请求弊端
我们举个栗子。现在有三个http请求。每个请求耗时2s。如果按照简单的curl请求(图1-(1))。耗时6s.这是不能容忍的。如果请求的个数越多耗时约多。
有没有一种方式来缩小查询时间?能不能三个http请求同时执行(如图1-(1))?有很多方法来解决这个问题,将耗时减少到2s。如:多进程、线程、事件循环、curl_multi_*等等。最简单的方式就是通过curl_multi_*函数来完成。事实上curl_multi_*内部实现就是用的事件循环。
三、简单的curl_multi_*运用
<code><span><?php </span><span>/** * * curl_multi_*简单运用 * *<span> @author</span>: rudy *<span> @date</span>: 2016/07/12 */</span><span>/** * 根据url,postData获取curl请求对象,这个比较简单,可以看官方文档 */</span><span><span>function</span><span>getCurlObject</span><span>(<span>$url</span>,<span>$postData</span>=array<span>()</span>,<span>$header</span>=array<span>()</span>)</span>{</span><span>$options</span> = <span>array</span>(); <span>$url</span> = trim(<span>$url</span>); <span>$options</span>[CURLOPT_URL] = <span>$url</span>; <span>$options</span>[CURLOPT_TIMEOUT] = <span>10</span>; <span>$options</span>[CURLOPT_USERAGENT] = <span>'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.89 Safari/537.36'</span>; <span>$options</span>[CURLOPT_RETURNTRANSFER] = <span>true</span>; <span>// $options[CURLOPT_PROXY] = '127.0.0.1:8888';</span><span>foreach</span>(<span>$header</span><span>as</span><span>$key</span>=><span>$value</span>){ <span>$options</span>[<span>$key</span>] =<span>$value</span>; } <span>if</span>(!<span>empty</span>(<span>$postData</span>) && is_array(<span>$postData</span>)){ <span>$options</span>[CURLOPT_POST] = <span>true</span>; <span>$options</span>[CURLOPT_POSTFIELDS] = http_build_query(<span>$postData</span>); } <span>if</span>(stripos(<span>$url</span>,<span>'https'</span>) === <span>0</span>){ <span>$options</span>[CURLOPT_SSL_VERIFYPEER] = <span>false</span>; } <span>$ch</span> = curl_init(); curl_setopt_array(<span>$ch</span>,<span>$options</span>); <span>return</span><span>$ch</span>; } <span>// 创建三个待请求的url对象</span><span>$chList</span> = <span>array</span>(); <span>$chList</span>[] = getCurlObject(<span>'https://www.baidu.com'</span>); <span>$chList</span>[] = getCurlObject(<span>'http://www.jd.com'</span>); <span>$chList</span>[] = getCurlObject(<span>'http://www.jianshu.com/'</span>); <span>// 创建多请求执行对象</span><span>$downloader</span> = curl_multi_init(); <span>// 将三个待请求对象放入下载器中</span><span>foreach</span> (<span>$chList</span><span>as</span><span>$ch</span>){ curl_multi_add_handle(<span>$downloader</span>,<span>$ch</span>); } <span>// 轮询</span><span>do</span> { <span>while</span> ((<span>$execrun</span> = curl_multi_exec(<span>$downloader</span>, <span>$running</span>)) == CURLM_CALL_MULTI_PERFORM) ; <span>if</span> (<span>$execrun</span> != CURLM_OK) { <span>break</span>; } <span>// 一旦有一个请求完成,找出来,处理,因为curl底层是select,所以最大受限于1024</span><span>while</span> (<span>$done</span> = curl_multi_info_read(<span>$downloader</span>)) { <span>// 从请求中获取信息、内容、错误</span><span>$info</span> = curl_getinfo(<span>$done</span>[<span>'handle'</span>]); <span>$output</span> = curl_multi_getcontent(<span>$done</span>[<span>'handle'</span>]); <span>$error</span> = curl_error(<span>$done</span>[<span>'handle'</span>]); <span>// 将请求结果保存,我这里是打印出来</span><span>print</span><span>$output</span>; <span>// print "一个请求下载完成!\n";</span><span>// 把请求已经完成了得 curl handle 删除</span> curl_multi_remove_handle(<span>$downloader</span>, <span>$done</span>[<span>'handle'</span>]); } <span>// 当没有数据的时候进行堵塞,把 CPU 使用权交出来,避免上面 do 死循环空跑数据导致 CPU 100%</span><span>if</span> (<span>$running</span>) { <span>$rel</span> = curl_multi_select(<span>$downloader</span>, <span>1</span>); <span>if</span>(<span>$rel</span> == -<span>1</span>){ usleep(<span>1000</span>); } } <span>if</span>( <span>$running</span> == <span>false</span>){ <span>break</span>; } } <span>while</span> (<span>true</span>); <span>// 下载完毕,关闭下载器</span> curl_multi_close(<span>$downloader</span>); <span>echo</span><span>"所有请求下载完成!"</span>;</span></code>
在该例子中,首先创建三个或多个要请求的url请求对象。通过curl_multi_*函数创建下载器。将请求写入下载器中。最后轮询。等待三个请求现在完成。做处理。
四、复杂的curl_multi_*运用
这就是curl_multi_*用法?too yong too simple!在上面的例子中。下载器$downloader中的请求是一开始就添加好了的。我们能不能动态的向下载器中添加请求。动态的从下载器中取出已经完成了的请求。想想。这是什么?这不就是爬虫的核心部分-动态下载器。如何动态的添加?我们可以用多进程通过IPC添加。我们可以通过协程通过队列添加等待。
').addClass('pre-numbering').hide(); $(this).addClass('has-numbering').parent().append($numbering); for (i = 1; i ').text(i)); }; $numbering.fadeIn(1700); }); });我这实现了一个通过协程+curl_multi_*的爬虫框架。
Tspider:https://github.com/hirudy/Tspider。
单进程可处理请求2000-5000/min。
以上就介绍了 php中curl_multi函数集的用法,包括了方面的内容,希望对PHP教程有兴趣的朋友有所帮助。

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

curl和Pythonrequests都是发送HTTP请求的强大工具。虽然curl是一种命令行工具,可让您直接从终端发送请求,但Python的请求库提供了一种更具编程性的方式来从Python代码中发送请求。将curl转换为Pythonrequestscurl命令的基本语法如下所示:curl[OPTIONS]URL将curl命令转换为Python请求时,我们需要将选项和URL转换为Python代码。这是一个示例curlPOST命令:curl-XPOSThttps://example.com/api

Hitomi Downloader 是微软 Windows 操作系统的开源媒体下载器,可以使用用户脚本进行扩展。该下载器默认支持从许多网站下载,包括 YouTube、Facebook、Twitch、Flickr、Imgur、Instagram、Wayback Machine、微博和 Pinterest。默认情况下,下载器还支持几个漫画网站以及成人网站和服务。Hitomi Downloader 也支持 youtube-dl 支持的所有站点。用户可以通过脚本扩展支持。可以在项目的 GitHub 页面

PHP8.1发布:引入curl多个请求并发处理近日,PHP官方发布了最新版本的PHP8.1,其中引入了一个重要的特性:curl多个请求并发处理。这个新特性为开发者提供了一个更加高效和灵活的方式来处理多个HTTP请求,极大地提升了性能和用户体验。在以往的版本中,处理多个请求往往需要通过创建多个curl资源,并使用循环来分别发送和接收数据。这种方式虽然能够实现目

从头到尾:如何使用php扩展cURL进行HTTP请求引言:在Web开发中,经常需要与第三方API或其他远程服务器进行通信。而使用cURL进行HTTP请求是一种常见而强大的方式。本文将介绍如何使用php扩展cURL来执行HTTP请求,并提供一些实用的代码示例。一、准备工作首先,确保php已安装cURL扩展。可以在命令行执行php-m|grepcurl查

在Linux下更新curl版本,您可以按照以下步骤进行操作:检查当前curl版本:首先,您需要确定当前系统中安装的curl版本。打开终端,并执行以下命令:curl--version该命令将显示当前curl的版本信息。确认可用的curl版本:在更新curl之前,您需要确定可用的最新版本。您可以访问curl的官方网站(curl.haxx.se)或相关的软件源,查找最新版本的curl。下载curl源代码:使用curl或浏览器,下载您选择的curl版本的源代码文件(通常为.tar.gz或.tar.bz2

PHPCurl中如何处理网页的301重定向?在使用PHPCurl发送网络请求时,时常会遇到网页返回的301状态码,表示页面被永久重定向。为了正确处理这种情况,我们需要在Curl请求中添加一些特定的选项和处理逻辑。下面将详细介绍在PHPCurl中如何处理网页的301重定向,并提供具体的代码示例。301重定向处理原理301重定向是指服务器返回了一个30

在linux中,curl是一个非常实用的、用来与服务器之间传输数据的工具,是一个利用URL规则在命令行下工作的文件传输工具;它支持文件的上传和下载,是综合传输工具。curl提供了一大堆非常有用的功能,包括代理访问、用户认证、ftp上传下载、HTTP POST、SSL连接、cookie支持、断点续传等等。

php curl设置cookie的方法:1、创建PHP示例文件;2、通过“curl_setopt”函数设置cURL传输选项;3、在CURL中传递cookie即可。
