首页 PHP 库 其它类库 网页抓取图片的PHP类
网页抓取图片的PHP类
<?php
header('Content-Type:text/html;charset=utf-8');
/**
 * 一个用于抓去图片的类
 */
class download_image {
    public $_save_path = NULL; //图片保存路劲
    public $_limit_size = NULL; //图片限制大小
    public static $_img_url_old = array();  //存储已抓取过的图片链接地址
    public static $_a_page_url = array();    //存储抓取过的页面
    public function __construct( $_save_path, $_limit_size) {
        $this->_save_path = $_save_path;
        $this->_limit_size = $_limit_size;
    }
    public function get_all_page_image( $site_url ) {
        if ( $site_url == '' ) {
            return false;
        }
        if ( ! in_array( $site_url, self::$_a_page_url ) ) {  //判断当前页面是否抓取过
            self::$_a_page_url[] = $site_url;   //将超链接存入静态数组中
        } else {
            return;     //若抓取过则跳出
        }

1.找到一个页面

2.正则过滤所有的img

3.正则过滤出所有的src的属性

4.获取链接信息,写入文件 file_get_contents(), file_put_contents()

5.在cli模式下运行代码(浏览器运行可能内存爆掉,或运行超时)


免责声明

本站所有资源均由网友贡献或各大下载网站转载。请自行检查软件的完整性!本站所有资源仅供学习参考。请不要将它们用于商业目的。否则,一切后果由您负责!如有侵权,请联系我们删除。联系方式:admin@php.cn

相关文章

php抓取远程图片到本地保存的方法 php抓取远程图片到本地保存的方法

02 Dec 2019

“php”抓取远程图片到本地保存的方法是:首先判断图片路径是否为空,如果不为空则进一步执行,接着获取图片信息大小、图片路径后缀名,然后计算图片源码大小,每次实现写入1k,直到获取到全部数据即可。

如何有效处理 PHP 网页抓取过程中的 404 错误? 如何有效处理 PHP 网页抓取过程中的 404 错误?

03 Dec 2024

如何有效处理 PHP 中的 404 错误在抓取网页时,遇到 404(未找到)错误可能会扰乱您的代码流程。为了避免这样的...

如何在 PHP 中使用网页抓取来预览给定的 URL? 如何在 PHP 中使用网页抓取来预览给定的 URL?

17 Oct 2024

PHP 中的网页抓取:预览给定 URL 您的目标是使用 PHP 从用户提供的网页中提取特定元素。在这种情况下,您的目标是检索页面的标题、徽标图像以及简短的文本或描述。推荐一个应用程序

在网页抓取之前如何有效检查 PHP 中的 404 错误? 在网页抓取之前如何有效检查 PHP 中的 404 错误?

19 Dec 2024

在 PHP 中测试 URL 404 的简单方法发现您的代码由于 URL 返回 404 而遇到问题,这是 Web 中的一个常见痛点...

如何使用自连接从自引用表中检索数据? 如何使用自连接从自引用表中检索数据?

13 Jan 2025

了解 SELF JOIN 及其应用程序在数据库管理领域中,SELF JOIN 是一种特殊类型的联接操作,它允许...

Oracle 数据库现在支持布尔数据类型吗? Oracle 数据库现在支持布尔数据类型吗?

12 Jan 2025

Oracle 数据库中布尔数据类型的可用性与其他 RDBMS(例如提供 BIT 数据类型的 Microsoft SQL Server)不同,Oracle 数据库...

See all articles