社区

学习

工具库

AI工具

休闲

简体中文

首页 > 后端开发 > php教程 > 经过URL抓取网页的TITLE，有些网站抓不到，方法愚笨，求指点

经过URL抓取网页的TITLE，有些网站抓不到，方法愚笨，求指点

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

发布： 2016-06-13 11:39:27

原创

943 人浏览过

通过URL抓取网页的TITLE，有些网站抓不到，方法愚笨，求指点。

本帖最后由 u012716911 于 2013-11-04 11:25:29 编辑代码是我自己这样想着写的，不知道还有没有更好的方法。请各位给些指点
有些网站可以抓到，如百度，有些网站就抓不到，比如太平洋汽车的首页。

<br />public function set_title()<br />	{<br />		// 获取进来URL<br />		$url = $_POST['url'];<br />		// $url = "www.pcauto.com.cn"; 抓不到！<br />		//一连串的curl设置		<br />		$ch = curl_init();<br />		curl_setopt($ch,CURLOPT_URL,$url);<br />		curl_setopt($ch,CURLOPT_HEADER,0);<br />		curl_setopt($ch,CURLOPT_ENCODING,'gzip');<br />		curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);<br />		$content_source = curl_exec($ch);<br />		curl_close($ch);<br />	<br />		//获取抓到内容的编码格式<br /><br />		$encode = mb_detect_encoding($content_source, array('GB2312','GBK','UTF-8','ASCII')); <br />		<br />		//转码<br />		$content_source = iconv($encode, 'utf-8//IGNORE',$content_source);<br />		<br />		//截取<title><br />		if(preg_match("/<title>(.*?)<\/title>/i",$content_source,$title))<br />		{<br />			echo $title[1];<br />		}<br />		else<br />		{<br />			echo '拉取标题失败';<br />		}<br />	}<br />

登录后复制

curl 抓取标题

相关标签：

content curl nbsp source title

上一篇：memcache 的使用环境,该怎么解决下一篇：如果你有一个代码出有关问题就把有关问题退给你的领导你该如何做

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

LLM的工作方式：培训前训练，神经网络，幻觉和推理

2025-02-26 03:58:14
我将区块链和AI组合在一起以生成艺术。接下来发生了什么。

2025-02-26 03:38:10
高级及时工程：思想链（COT）

2025-02-26 03:17:10
在Sqlite中检索增强发电

2025-02-26 02:49:09
如何使用LLM驱动的样板构建自己的节点。JSAPI

2025-02-26 01:08:13
2024年编码的LLM：价格，性能和争取最佳的战斗

2025-02-26 00:46:10
提示视觉语言模型

2025-02-25 23:42:08
如何衡量大语模型的响应的可靠性

2025-02-25 22:50:13
生活的幻想

2025-02-25 21:54:11
科学家对大型语言模型的认真反映了人类思维

2025-02-25 20:45:11

最新问题

php常量和变量之外部变量教材里的代码问题

来自于 1970-01-01 08:00:00

0

0

0

javascript - js正则匹配特定字符串

来自于 1970-01-01 08:00:00

0

0

0

为什么说非对象调用成员函数fetch()

来自于 1970-01-01 08:00:00

0

0

0

第77行说非对象调用函数fetch()那位大牛解释一下实在找不到

来自于 1970-01-01 08:00:00

0

0

0

微信$data =file_get_contents('php://input')取不到数据，抓包

来自于 1970-01-01 08:00:00

0

0

0

相关专题

更多>

热门推荐

热门教程

更多>

相关教程

热门推荐

最新课程

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1436662
php入门教程之一周学会PHP

4296140
JAVA 初级入门视频教程

2661679
小甲鱼零基础入门学习Python视频教程

516413
PHP 零基础入门教程

877044

最新下载

更多>

网站特效

网站源码

网站素材

前端模板