1、cURL请求的基本步骤:
(1)初始化
(2)设置选项,包括URL
(3)执行并获取HTML文档内容
(4)释放cURL句柄
//2、设置选项,包括URL
curl_setopt($ch, CURLOPT_URL, "http://www.cnblogs.com/it-cen/");
//将curl_exec()获取的信息以文件流的形式返回,而不是直接输出
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
//启动时会将头文件的信息作为数据流输出
curl_setopt($ch, CURLOPT_HEADER, 1);
//3、执行并获取HTML文档内容
curl_exec($ch);
//4、释放句柄
curl_close($ch);
echo $ch;
?>
注意:第二步最重要,也就是curl_setopt()函数
我们可以加一段检查错误的语句,这里要注意用的是"===false",这是为了区分空输出和布尔值false
curl_getinfo()函数返回cURL执行后这一请求相关的信息,这对调试和排错很有用:
';<br> print_r($info); <br> echo '
返回的数据
2、这些信息在调试很有用,例如在cURL抓取的时候,可能由于网络等原因,时常出现抓取数据不完整的情况,这是我们可以通过所获取的数据计算filesize,然后和curl_getinfo()获取的进行比较,如果大小相等,就认定下载正确,否则进行重复尝试。
下面我们看一个抓取图片的例子:
//1、初始化
$ch = curl_init();
//2、设置选项,包括URL
curl_setopt($ch, , CURLOPT_URL, "http://img04.taobaocdn.com/tfscom/TB1omaTHXXXXXajXVXXtKXbFXXX.png");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_HEADER, 1);
//3、执行并获取内容
$res = curl_exec($ch);
//获取信息
$info = curl_getinfo($ch);
//4、释放资源
curl_close($ch);
file_put_contents("d:/aa.png", $res);
$size = filesize("d:/aa.png");
if ($size != $info['size_download']) {
echo "下载的数据不完整,请重新下载";
} else {
echo "下载数据完整";
}
?>
3、在cURL中用POST方法发送数据
$data = array('name'=>'kelly', 'age'=>27, 'sex'=>1);
curl_setopt($ch, CURLOPT_URL, "http://localhost.post.php");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
//设置为post
curl_setopt($ch, CURLOPT_POST, 1);
//把post的变量加上
curl_setopt($ch, CURLOPT_POSTFIELDS,$data);
$res = curl_exec($ch);
curl_close($ch);
echo $res;
?>
用此方法可以模拟留言,或者可以坐灌水机器人,思路都是一样的
4、用cURL上传文件
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "http://127.0.0.1/Socket/upload_file.php");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, $data);
$res = curl_exec($ch);
curl_close($ch);
echo $res;
?>
注意:要发送文件时,要在文件名前面加上 @ 前缀并使用完整路径
5、cURL设置项
其实,cURL有许多配置选项,这些选项才是cURL的灵魂,通过setopt()设置,下面总结几个比较常见且重要的配置项,希望在对读者在以后用到cURL时有一定的帮助:
CURLOPT_AUTOREFERER:当根据location:重定向时,自动设置header中的Referer:信息
CURLOPT_COOKIESESSION:启用时cURL会紧紧传递一个sessioncookie,忽略其他cookie
CURLOPT_HEADER:将头文件的信息作为数据流输出
CURLOPT_INFILESIZE:设置上传文件的大小,单位为字节
CURLOPT_MAXCONNECTS:允许最大连接数量
CURLOPT_MAXREDIRS:指定HTTP重定向的最多数量
CURLOPT_COOKIE:设置HTTP请求中“cookie:”部分的内容,多个cookie用分号跟个,分号后带一个空格
CURLOPT_POSTFIELDS:全部数据用HTTP协议中的“POST”操作发送要发送文件,在文件名前面加上@前缀并使用完整路径
.......
具体更多配置项请参考PHP手册
cURL功能很强大,它是一个通用的库,并非PHP独有。
希望读者通过本博文的几个经典cURL例子的学习能有所收获。