网页抓取图片的PHP类
<?php header('Content-Type:text/html;charset=utf-8'); /** * 一个用于抓去图片的类 */ class download_image { public $_save_path = NULL; //图片保存路劲 public $_limit_size = NULL; //图片限制大小 public static $_img_url_old = array(); //存储已抓取过的图片链接地址 public static $_a_page_url = array(); //存储抓取过的页面 public function __construct( $_save_path, $_limit_size) { $this->_save_path = $_save_path; $this->_limit_size = $_limit_size; } public function get_all_page_image( $site_url ) { if ( $site_url == '' ) { return false; } if ( ! in_array( $site_url, self::$_a_page_url ) ) { //判断当前页面是否抓取过 self::$_a_page_url[] = $site_url; //将超链接存入静态数组中 } else { return; //若抓取过则跳出 }
1.找到一个页面
2.正则过滤所有的img
3.正则过滤出所有的src的属性
4.获取链接信息,写入文件 file_get_contents(), file_put_contents()
5.在cli模式下运行代码(浏览器运行可能内存爆掉,或运行超时)
免责声明
本站所有资源均由网友贡献或各大下载网站转载。请自行检查软件的完整性!本站所有资源仅供学习参考。请不要将它们用于商业目的。否则,一切后果由您负责!如有侵权,请联系我们删除。联系方式:admin@php.cn
相关文章
php抓取远程图片到本地保存的方法
02 Dec 2019
“php”抓取远程图片到本地保存的方法是:首先判断图片路径是否为空,如果不为空则进一步执行,接着获取图片信息大小、图片路径后缀名,然后计算图片源码大小,每次实现写入1k,直到获取到全部数据即可。
如何有效处理 PHP 网页抓取过程中的 404 错误?
03 Dec 2024
如何有效处理 PHP 中的 404 错误在抓取网页时,遇到 404(未找到)错误可能会扰乱您的代码流程。为了避免这样的...
如何在 PHP 中使用网页抓取来预览给定的 URL?
17 Oct 2024
PHP 中的网页抓取:预览给定 URL 您的目标是使用 PHP 从用户提供的网页中提取特定元素。在这种情况下,您的目标是检索页面的标题、徽标图像以及简短的文本或描述。推荐一个应用程序
在网页抓取之前如何有效检查 PHP 中的 404 错误?
19 Dec 2024
在 PHP 中测试 URL 404 的简单方法发现您的代码由于 URL 返回 404 而遇到问题,这是 Web 中的一个常见痛点...
Oracle 数据库现在支持布尔数据类型吗?
12 Jan 2025
Oracle 数据库中布尔数据类型的可用性与其他 RDBMS(例如提供 BIT 数据类型的 Microsoft SQL Server)不同,Oracle 数据库...
Hot Tools
热门文章
崩坏:星穹铁道 - 所有金色替罪羊谜题解决方案
18 Jan 2025
手游攻略
Tales Of Graces F 重制版:所有锁定的宝箱密码
18 Jan 2025
手游攻略
鲁马岛:考古学家职业指南
03 Jan 2025
手游攻略
如何修复 KB5049622 在 Windows 11 中安装失败的问题?
15 Jan 2025
故障排查
印第安纳琼斯与大圈:Gizeh 药瓶位置指南
31 Dec 2024
手游攻略