コミュニティ

学ぶ

ツールライブラリ

AIツール

レジャー

日本語

ホームページ > バックエンド開発 > PHPチュートリアル > 经过URL抓取网页的TITLE，有些网站抓不到，方法愚笨，求指点

经过URL抓取网页的TITLE，有些网站抓不到，方法愚笨，求指点

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

リリース： 2016-06-13 11:39:27

オリジナル

937 人が閲覧しました

通过URL抓取网页的TITLE，有些网站抓不到，方法愚笨，求指点。

本帖最后由 u012716911 于 2013-11-04 11:25:29 编辑代码是我自己这样想着写的，不知道还有没有更好的方法。请各位给些指点
有些网站可以抓到，如百度，有些网站就抓不到，比如太平洋汽车的首页。

<br />public function set_title()<br />	{<br />		// 获取进来URL<br />		$url = $_POST['url'];<br />		// $url = "www.pcauto.com.cn"; 抓不到！<br />		//一连串的curl设置		<br />		$ch = curl_init();<br />		curl_setopt($ch,CURLOPT_URL,$url);<br />		curl_setopt($ch,CURLOPT_HEADER,0);<br />		curl_setopt($ch,CURLOPT_ENCODING,'gzip');<br />		curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);<br />		$content_source = curl_exec($ch);<br />		curl_close($ch);<br />	<br />		//获取抓到内容的编码格式<br /><br />		$encode = mb_detect_encoding($content_source, array('GB2312','GBK','UTF-8','ASCII')); <br />		<br />		//转码<br />		$content_source = iconv($encode, 'utf-8//IGNORE',$content_source);<br />		<br />		//截取<title><br />		if(preg_match("/<title>(.*?)<\/title>/i",$content_source,$title))<br />		{<br />			echo $title[1];<br />		}<br />		else<br />		{<br />			echo '拉取标题失败';<br />		}<br />	}<br />

ログイン後にコピー

curl 抓取标题

関連ラベル：

content curl nbsp source title

前の記事：memcache 的使用环境,该怎么解决次の記事：如果你有一个代码出有关问题就把有关问题退给你的领导你该如何做

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

著者別の最新記事

NullPointerException とは何ですか?どのように修正すればよいですか?

2024-10-22 09:46:29
初心者からプログラマーへ: 旅は C の基礎から始まります

2024-10-13 13:53:41
PHP による Web 開発のロックを解除する: 初心者ガイド

2024-10-12 12:15:51
C の謎を解く: 新人プログラマーのための明確でシンプルな道

2024-10-11 22:47:31
コーディングの可能性を解き放つ: まったくの初心者のための C プログラミング

2024-10-11 19:36:51
内なるプログラマーを解き放つ: まったくの初心者のための C

2024-10-11 15:50:41
C で生活を自動化する: 初心者向けのスクリプトとツール

2024-10-11 15:07:41
PHP を簡単に: Web 開発の最初のステップ

2024-10-11 14:21:21
Python で何でも構築: 創造性を解き放つための初心者ガイド

2024-10-11 12:59:11
コーディングの鍵: 初心者のための Python の力を解き放つ

2024-10-11 12:17:31

最新の問題

PHPの定数と変数外部変数教科書のコード問題

から 1970-01-01 08:00:00

0

0

0

QR コードを生成できないのはなぜですか?

から 1970-01-01 08:00:00

0

0

0

非オブジェクトがメンバー関数 fetch() を呼び出すと言われるのはなぜですか

から 1970-01-01 08:00:00

0

0

0

77 行目で、非オブジェクトが関数 fetch() を呼び出すと書かれていますが、誰か説明してもらえますか? まったく見つかりません。

から 1970-01-01 08:00:00

0

0

0

C# シリアルポートクラスは動的データを読み取ります。このデータを転送するにはどうすればよいですか?

から 1970-01-01 08:00:00

0

0

0

関連トピック

詳細>

人気のおすすめ

人気のチュートリアル

詳細>

関連するチュートリアル

人気のおすすめ

最新のコース

最新のダウンロード

詳細>

ウェブエフェクト

公式サイト

サイト素材

フロントエンドテンプレート