花5分钟用php做个图片采集器
博主热衷各种互联网技术,常啰嗦,时常伴有强迫症,常更新,觉得文章对你有帮助的可以关注我。 转载请注明"深蓝的镰刀"
采集的核心还是正则匹配,正则我不是特别熟练,网上很多抓img标签的方法,但是我的目的是抓到img中的src属性的值,而且必须满足贪心匹配,否则正则匹配会尽可能匹配长的字串。总之,我花了不止5分钟。。。不过相信正则熟练的同学真的只用5分钟就能搞定这个采集了。
<?php class Crawler{ static private $output = array(); static private $web_content = ''; public function __construct($url){ if( false === self::$web_content = file_get_contents($url)){ self::$web_content = ''; } } static public function getImage(){ if( '' != self::$web_content ){ preg_match_all('/<img(.*?)src=\"([^\"]*)\"/i',self::$web_content,self::$output); } } static public function output(){ var_dump(self::$output); } static public function render(){ foreach(self::$output[2] as $o){ echo "<img src=\"$o\" alt="花5分钟用php做个图片采集器" >"; } } } $crawler = new Crawler('http://blog.csdn.net/hornedreaper1988'); $crawler::getImage(); //$crawler::output(); $crawler::render();
以上就介绍了花5分钟用php做个图片采集器,包括了方面的内容,希望对PHP教程有兴趣的朋友有所帮助。

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

报错的原因NameResolutionError(self.host,self,e)frome是由urllib3库中的异常类型,这个错误的原因是DNS解析失败,也就是说,试图解析的主机名或IP地址无法找到。这可能是由于输入的URL地址不正确,或者DNS服务器暂时不可用导致的。如何解决解决此错误的方法可能有以下几种:检查输入的URL地址是否正确,确保它是可访问的确保DNS服务器可用,您可以尝试在命令行中使用"ping"命令来测试DNS服务器是否可用尝试使用IP地址而不是主机名来访问网站如果是在代理

在介绍Python的self用法之前,先来介绍下Python中的类和实例我们知道,面向对象最重要的概念就是类(class)和实例(instance),类是抽象的模板,比如学生这个抽象的事物,可以用一个Student类来表示。而实例是根据类创建出来的一个个具体的“对象”,每一个对象都从类中继承有相同的方法,但各自的数据可能不同。1、以Student类为例,在Python中,定义类如下:classStudent(object):pass(Object)表示该类从哪个类继承下来的,Object类是所有

php提交表单通过后,弹出的对话框怎样在当前页弹出php提交表单通过后,弹出的对话框怎样在当前页弹出而不是在空白页弹出?想实现这样的效果:而不是空白页弹出:------解决方案--------------------如果你的验证用PHP在后端,那么就用Ajax;仅供参考:HTML code

前端output配置,需要具体代码示例前端开发中,output配置是一项非常重要的配置。它用于定义项目打包后生成的文件路径、文件名以及相关的资源路径等。本文将介绍前端output配置的作用、常用配置选项,并给出具体的代码示例。output配置的作用:output配置项用于指定项目打包后生成的文件路径和文件名。它决定了项目的最终输出结果。在webpack等打包

将所有的资源(assets)归拢在一起后,还需要告诉 webpack 在哪里打包应用程序。webpack 的 output 属性描述了如何处理归拢在一起的代码(bundled code)。下面本篇文章就来带大家深入了解一下webpack核心概念中的输出(Output),希望对大家有所帮助!

CSS内容属性详解:content、counter和quotesCSS(层叠样式表)是前端开发中不可或缺的一部分,它可以帮助我们美化网页并增强用户体验。在CSS中,有一些特殊的属性可以用于控制文本内容的显示,其中包括content、counter和quotes。本文将详细介绍这些属性,并提供具体的代码示例。一、content属性content属性

Python中的self的理解及示例在Python中,self是一个特殊的参数,它用于表示类的实例对象本身。通过self,我们可以在类的方法中访问类的成员变量和方法。在此文章中,我将解释self的作用,以及如何正确使用self来访问类的成员。首先,让我们来理解self的概念。在Python中,定义类的时候,第一个参数通常为self。这个self参数指向类的实

这篇文章将为大家详细讲解有关PHP将GD图像输出到浏览器或文件,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。PHP将GD图像输出到浏览器或文件引言phpGD库为处理图像提供了强大的功能,允许您创建、编辑和输出图像。可以将图像输出到浏览器或文件,以进行显示或进一步处理。输出到浏览器要将图像输出到浏览器,请使用以下步骤:创建图像资源:使用imagecreate()函数创建图像资源。加载图像数据:使用imagepng()、imagejpeg()或imagegif()
