curl - php 各种方法获取微信图文页面图片不显示
file_get_contents
curl
PHP Simple HTML DOM解析器
三种方法获取html,图片都不会显示,curl也模拟了浏览器。
以下图文页链接为例
微信图文页面
比如以html dom方式获取代码:
<code>$html = new simple_html_dom(); $html->load_file($artical_url); echo "$html";</code>
php获取代码后,第一张图片的代码:
<code><img src="/static/imghw/default1.png" data-src="http://mmbiz.qpic.cn/mmbiz/zynprs47B4SSmGjHh9gJq59bct0TbDmksGMe4kRiaFTspugicmSwLVVfK13HdQbKIR7gaxxwF6icEVT3tCp33IOtg/0?wx_fmt=gif" class="lazy" data-type="gif" data-ratio="0.29676258992805754" data-w="" style="max-width:90%" data- style="margin: 0px; padding: 0px; width: 670px; height: auto !important; box-sizing: border-box !important; word-wrap: break-word !important; visibility: visible !important;" alt="curl - php 各种方法获取微信图文页面图片不显示" ></code>
浏览器访问页面正常显示图片的代码:
<code><img src="/static/imghw/default1.png" data-src="http://mmbiz.qpic.cn/mmbiz/zynprs47B4SSmGjHh9gJq59bct0TbDmksGMe4kRiaFTspugicmSwLVVfK13HdQbKIR7gaxxwF6icEVT3tCp33IOtg/0?wx_fmt=gif" class="lazy" data-type="gif" data-ratio="0.29676258992805754" data-w="" style="max-width:90%" data- style="width: 670px !important; box-sizing: border-box !important; word-wrap: break-word !important; visibility: visible !important; height: auto !important;" _width="670px" alt="curl - php 各种方法获取微信图文页面图片不显示" ></code>
咋么办??
回复内容:
file_get_contents
curl
PHP Simple HTML DOM解析器
三种方法获取html,图片都不会显示,curl也模拟了浏览器。
以下图文页链接为例
微信图文页面
比如以html dom方式获取代码:
<code>$html = new simple_html_dom(); $html->load_file($artical_url); echo "$html";</code>
php获取代码后,第一张图片的代码:
<code><img src="/static/imghw/default1.png" data-src="http://mmbiz.qpic.cn/mmbiz/zynprs47B4SSmGjHh9gJq59bct0TbDmksGMe4kRiaFTspugicmSwLVVfK13HdQbKIR7gaxxwF6icEVT3tCp33IOtg/0?wx_fmt=gif" class="lazy" data-type="gif" data-ratio="0.29676258992805754" data-w="" style="max-width:90%" data- style="margin: 0px; padding: 0px; width: 670px; height: auto !important; box-sizing: border-box !important; word-wrap: break-word !important; visibility: visible !important;" alt="curl - php 各种方法获取微信图文页面图片不显示" ></code>
浏览器访问页面正常显示图片的代码:
<code><img src="/static/imghw/default1.png" data-src="http://mmbiz.qpic.cn/mmbiz/zynprs47B4SSmGjHh9gJq59bct0TbDmksGMe4kRiaFTspugicmSwLVVfK13HdQbKIR7gaxxwF6icEVT3tCp33IOtg/0?wx_fmt=gif" class="lazy" data-type="gif" data-ratio="0.29676258992805754" data-w="" style="max-width:90%" data- style="width: 670px !important; box-sizing: border-box !important; word-wrap: break-word !important; visibility: visible !important; height: auto !important;" _width="670px" alt="curl - php 各种方法获取微信图文页面图片不显示" ></code>
咋么办??
感谢楼上的回答,应该不是防盗链的问题,感觉是抓取的时候dom的规则不能判断data-src和src的属性。后来研究了半天,发现simple_html_dom确实个好东西,应该可以在抓取回来后用替换的方式。无奈因对php还不是很熟,语句老是写不正确。后来用js土办法曲线救国,取得php变量内容并正则替换的方式解决了问题。
另外加一句,用html_dom后,别忘了$html->clear。
修改curl header参数 试试
https://segmentfault.com/q/1010000005046169
感觉你的问题跟这个有点像,你试试看

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

PHP 8.4 带来了多项新功能、安全性改进和性能改进,同时弃用和删除了大量功能。 本指南介绍了如何在 Ubuntu、Debian 或其衍生版本上安装 PHP 8.4 或升级到 PHP 8.4

CakePHP 是 PHP 的开源框架。它的目的是使应用程序的开发、部署和维护变得更加容易。 CakePHP 基于类似 MVC 的架构,功能强大且易于掌握。模型、视图和控制器 gu

Visual Studio Code,也称为 VS Code,是一个免费的源代码编辑器 - 或集成开发环境 (IDE) - 可用于所有主要操作系统。 VS Code 拥有针对多种编程语言的大量扩展,可以轻松编写

CakePHP 是一个开源MVC 框架。它使开发、部署和维护应用程序变得更加容易。 CakePHP 有许多库可以减少大多数常见任务的过载。

本教程演示了如何使用PHP有效地处理XML文档。 XML(可扩展的标记语言)是一种用于人类可读性和机器解析的多功能文本标记语言。它通常用于数据存储
