[PHP] CURL 入门
前言
本文适用于有一定 PHP 基础的用户。
开发环境 WAMPSERVER 2.4 + Windows 10
个人对 CURL 的理解:
CURL 就是用来模拟浏览器行为的工具,用于数据的访问、提交和文件下载。
开启 CURL 拓展
-
手动开启 —— 修改 PHP.ini
去掉extension=php_curl.dll前面的分号。
-
自动开启 —— 在 WAMP 直接开启
CURL 的基本模式
<?php $url = '你想访问的地址'; $ch = curl_init();//初始化CURL对话 -> 可以理解为 打开浏览器 curl_setopt($ch, CURLOPT_URL,$url);//设置CURL参数 -> 可以理解成 调整浏览器的参数(即设置访问地址和一些其他浏览器参数)$result = curl_exec($ch);//执行CURL操作 -> 可以理解为 上面的参数设定好了,这一步才开始执行curl_close($ch);//关闭CURL -> 可以理解为 关闭浏览器 ?>
CURL 的模拟访问
我这边尝试着去模拟访问学校的教务系统。
寻找提交字段
我先用浏览器登录一遍。
通过用Fiddle抓包发现,我需要构建的提交字段有以下几个:
然后我发现 __VIEWSTATE 字段的值是动态生成的。
其他隐藏域的值要么为空,要么是固定的。
构建提交字段
因为 __VIEWSTATE 字段的值是动态生成的。
我们可以先用 CURL 抓取整个 HTML 页面,用正则匹配出 __VIEWSTATE 字段的值。
再来构建我们的提交字段。
$url = "http://jwgl.szpt.edu.cn/SzptJwBsII/Secure/login.aspx";$cookie_file = dirname(__FILE__) . '/cookie.txt'; //设置COOKIE存放目录 /** 第一步,获取 __VIEWSTATE 隐藏域的值**/ $ch = curl_init();curl_setopt($ch, CURLOPT_URL, $url); //设置访问的URL。curl_setopt($ch, CURLOPT_HEADER, 1); //是否输出 HTTP 头部信息。 1 输出 / 0 不输出curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); //是否把返回的值存储进变量。 1 存进变量 / 0 直接输出curl_setopt($ch, CURLOPT_COOKIEJAR, $cookie_file);//将 cookie 存在指定的目录。 $result = curl_exec($ch);curl_close($ch); preg_match('/name="__VIEWSTATE" value="(.*)"/',$result,$str); $str = $str['1']; $post = array( '__EVENTTARGET' => 'btnLogin', '__EVENTARGUMENT'=> '', '__VIEWSTATE' => $str, '__VIEWSTATEGENERATOR' => '210E3F16', 'ddlUserType' => '0', 'txtLogin' => '账号', 'txtPwd' => '密码' );
提交构建字段
查看原 HTML 页面中 form 标签的 action 属性,我们可以知道,他是提交到本页面。
代码承接第一步的内容 /** 第二步,提交构建字段,并获取cookie**/ $ch = curl_init();curl_setopt($ch, CURLOPT_URL, $url);curl_setopt($ch, CURLOPT_HEADER, 1); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);curl_setopt($ch,CURLOPT_POST,1); //设置是否用 POST 提交。 1 POST / 0 GETcurl_setopt($ch,CURLOPT_POSTFIELDS,$post);//设置 POST 提交的内容curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie_file);//读取 COOKIE 并在访问时带上。curl_setopt($ch, CURLOPT_COOKIEJAR, $cookie_file); //存储响应时的 COOKIE $result = curl_exec($ch);curl_close($ch);
通过打印结果(即打印 $result )可以发现,我们成功拿到了cookie。
带着cookie去登陆成功页面
/* * 第三步 ,带着cookie去登陆之后的页面 * */ $Second_url='http://jwgl.szpt.edu.cn/SzptJwBsII/default.aspx'; $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $Second_url); curl_setopt($ch, CURLOPT_HEADER, 1); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie_file); $result = curl_exec($ch); curl_close($ch);
通过打印结果(即打印 $result )可以发现,我们成功进入了个人页面。
总结
代码 github 地址:https://github.com/Modokey/CURL_DEMO/blob/master/demo.php
加深了个人对浏览器数据交互的一些了解。
对 HTTP HEADER , 开始能看懂一些了。
在百度学习 CURL 过程中,也认知到了一般做模拟访问都会带上 UA & IP。
如果有什么不对的地方,欢迎各位予以斧正。

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

JWT是一种基于JSON的开放标准,用于在各方之间安全地传输信息,主要用于身份验证和信息交换。1.JWT由Header、Payload和Signature三部分组成。2.JWT的工作原理包括生成JWT、验证JWT和解析Payload三个步骤。3.在PHP中使用JWT进行身份验证时,可以生成和验证JWT,并在高级用法中包含用户角色和权限信息。4.常见错误包括签名验证失败、令牌过期和Payload过大,调试技巧包括使用调试工具和日志记录。5.性能优化和最佳实践包括使用合适的签名算法、合理设置有效期、

会话劫持可以通过以下步骤实现:1.获取会话ID,2.使用会话ID,3.保持会话活跃。在PHP中防范会话劫持的方法包括:1.使用session_regenerate_id()函数重新生成会话ID,2.通过数据库存储会话数据,3.确保所有会话数据通过HTTPS传输。

SOLID原则在PHP开发中的应用包括:1.单一职责原则(SRP):每个类只负责一个功能。2.开闭原则(OCP):通过扩展而非修改实现变化。3.里氏替换原则(LSP):子类可替换基类而不影响程序正确性。4.接口隔离原则(ISP):使用细粒度接口避免依赖不使用的方法。5.依赖倒置原则(DIP):高低层次模块都依赖于抽象,通过依赖注入实现。

在PHPStorm中如何进行CLI模式的调试?在使用PHPStorm进行开发时,有时我们需要在命令行界面(CLI)模式下调试PHP�...

如何在系统重启后自动设置unixsocket的权限每次系统重启后,我们都需要执行以下命令来修改unixsocket的权限:sudo...

静态绑定(static::)在PHP中实现晚期静态绑定(LSB),允许在静态上下文中引用调用类而非定义类。1)解析过程在运行时进行,2)在继承关系中向上查找调用类,3)可能带来性能开销。

使用PHP的cURL库发送JSON数据在PHP开发中,经常需要与外部API进行交互,其中一种常见的方式是使用cURL库发送POST�...
