Gemeinschaft

Lernen

Tools-Bibliothek

KI-Tools

Freizeit

Deutsch

Heim > Backend-Entwicklung > PHP-Tutorial > 经过URL抓取网页的TITLE，有些网站抓不到，方法愚笨，求指点

经过URL抓取网页的TITLE，有些网站抓不到，方法愚笨，求指点

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Freigeben： 2016-06-13 12:34:06

Original

925 Leute haben es durchsucht

通过URL抓取网页的TITLE，有些网站抓不到，方法愚笨，求指点。

本帖最后由 u012716911 于 2013-11-04 11:25:29 编辑代码是我自己这样想着写的，不知道还有没有更好的方法。请各位给些指点
有些网站可以抓到，如百度，有些网站就抓不到，比如太平洋汽车的首页。

<br />
public function set_title()<br />
	{<br />
		// 获取进来URL<br />
		$url = $_POST['url'];<br />
		// $url = "www.pcauto.com.cn"; 抓不到！<br />
		//一连串的curl设置		<br />
		$ch = curl_init();<br />
		curl_setopt($ch,CURLOPT_URL,$url);<br />
		curl_setopt($ch,CURLOPT_HEADER,0);<br />
		curl_setopt($ch,CURLOPT_ENCODING,'gzip');<br />
		curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);<br />
		$content_source = curl_exec($ch);<br />
		curl_close($ch);<br />
	<br />
		//获取抓到内容的编码格式<br />
<br />
		$encode = mb_detect_encoding($content_source, array('GB2312','GBK','UTF-8','ASCII')); <br />
		<br />
		//转码<br />
		$content_source = iconv($encode, 'utf-8//IGNORE',$content_source);<br />
		<br />
		//截取<title><br />
		if(preg_match("/<title>(.*?)<\/title>/i",$content_source,$title))<br />
		{<br />
			echo $title[1];<br />
		}<br />
		else<br />
		{<br />
			echo '拉取标题失败';<br />
		}<br />
	}<br />

Nach dem Login kopieren

curl 抓取标题

Verwandte Etiketten：

content curl nbsp source title

Vorheriger Artikel： Synfony开发第二篇解决方案 Nächster Artikel： php中的 action 干参数，有什么特殊含义吗？见代码

Erklärung dieser Website

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Neueste Artikel des Autors

Wie LLMs funktionieren: Vorausbildung zu Nachtraining, neuronalen Netzwerken, Halluzinationen und Inferenz

2025-02-26 03:58:14
Ich kombinierte die Blockchain und die KI, um Kunst zu erzeugen. Hier ist das, was als nächstes geschah.

2025-02-26 03:38:10
Erweiterte schnelle Technik: Denkkette (COT)

2025-02-26 03:17:10
Wiederaufnahme der Augmented -Generation in SQLite

2025-02-26 02:49:09
So verwenden Sie eine mit LLM betriebene Kesselplatte zum Erstellen Ihrer eigenen Node.js-API

2025-02-26 01:08:13
LLMs für die Codierung im Jahr 2024: Preis, Leistung und der Kampf um das Beste

2025-02-26 00:46:10
Sehenssprachmodelle auffordern

2025-02-25 23:42:08
So messen Sie die Zuverlässigkeit der Reaktion eines Großsprachenmodells

2025-02-25 22:50:13
Eine Illusion des Lebens

2025-02-25 21:54:11
Wissenschaftler werden es ernst mit großen Sprachmodellen, die das menschliche Denken widerspiegeln

2025-02-25 20:45:11

Aktuelle Ausgaben

Javascript – js reguläre Übereinstimmung mit einer bestimmten Zeichenfolge

Aus 1970-01-01 08:00:00

0

0

0

[0]Schwerwiegender Fehler: Klasse „\think\cache\driver\File“ nicht gefunden[D:\myphp_www\PHPTutorial\WWW\tp5\thinkphp\library\think\Cache.php:65]. Was ist der Grund?

Aus 1970-01-01 08:00:00

0

0

0

Jetzt wird nur ein Datenelement zurückgegeben. Wie werden alle Daten zurückgegeben, die die Bedingungen erfüllen?

Aus 1970-01-01 08:00:00

0

0

0

PHP-Konstanten und Variablen, externe Variablen, Codeprobleme im Lehrbuch

Aus 1970-01-01 08:00:00

0

0

0

Warum kann ich keinen QR-Code generieren?

Aus 1970-01-01 08:00:00

0

0

0

verwandte Themen

Mehr>

Beliebte Empfehlungen

Beliebte Tutorials

Mehr>

Verwandte Tutorials

Beliebte Empfehlungen

Aktuelle Kurse

Neueste Downloads

Mehr>

Web-Effekte

Quellcode der Website

Website-Materialien

Frontend-Vorlage