ホームページ バックエンド開発 PHPチュートリアル PHP は指定された URL ページ内のすべてのリンクを取得します

PHP は指定された URL ページ内のすべてのリンクを取得します

Jun 13, 2016 pm 12:18 PM
href html nbsp url

PHP は、指定された URL ページ内のすべてのリンクを取得します。

form:http://www.uphtm.com/php/253.html

これは、実際に開発者によって一般的に使用されています。以前、他のウェブサイトからフレンドリーリンクを取得するプログラムを作成するときに使用しました。今日、友人が指定された URL ページ内のすべてのリンク関数を取得する PHP 関数をコンパイルしたのを見てみましょう。

次のコードは、指定された URL ページ内のすべてのリンク、つまりすべての a タグの href 属性を取得できます:

  1. // リンクの HTML コードを取得します
  2. $ html = file_get_contents('http://www.111cn.net');
  3. $dom = new DOMDocument();
  4. @$dom->loadHTML( $html);
  5. $xpath = new DOMXPath($dom);
  6. $hrefs = $xpath->evaluate('/html/body//a');
  7. for ( $i = 0; $i length; $i ) {
  8. $href = $hrefs->item($i);
  9. $url = $ href->getAttribute('href');
  10. echo $url.'
    ';
  11. }

このコードはすべての a タグの href 属性を取得しますが、href 属性値は必ずしもリンクである必要はなく、http:

    で始まるリンク アドレスのみを保持できます。
  1. // リンクの HTML コードを取得します
  2. $html = file_get_contents('http://www.111cn.net');
  3. $dom = new DOMDocument();
  4. @ $dom->loadHTML($html);
  5. $xpath = new DOMXPath($dom);
  6. $hrefs = $xpath->evaluate( '/html/body// a');
  7. for ($i = 0; $i < $hrefs->length; $i ) {
  8. $href = $hrefs ->item($i );
  9. $url = $href->getAttribute('href');
  10. // http
  11. if (substr($url, 0, 4) == 'http')
  12. echo $url.'
    ';
  13. }
fopen() 関数は、指定された Web ページ内のすべてのリンクを読み取り、その数をカウントします。このコードは、Web ページのコンテンツを収集する必要がある場所での使用に適しています。 Baidu ホーム ページの読み取りは、Baidu ホーム ページのすべてのリンクを見つけるための例として使用されます。コードはテスト済みで完全に使用可能です:

  1. if(empty($url))$url = "http://www.baidu.com/ ";//収集する必要がある URL アドレス
  2. $site=substr($url ,0,strpos($url,"/",8));
  3. $base=substr( $url,0,strrpos($url,"/") 1);//ファイルが見つかりました
  4. $fp = fopen($url, "r" );//URL アドレスのページを開きます
  5. while(!feof($fp))$contents.=fread( $fp,1024);
  6. $pattern="|href=['"]?([^ '"] )[ '" ]|U";
  7. preg_match_all($pattern, $contents, $regArr, PREG_SET_ORDER);//正規表現を使用してすべてに一致します href=
  8. for($i=0;$i< ;count($regArr);$i ){//一致するものをすべて検索しますlinks
  9. if(!eregi("://",$regArr[$i][1]))//相対パスかどうか、つまり://<が残っているかどうかを判定🎜>
  10. if(substr($regArr[$i][1],0,1)=="/")//サイトのルートディレクトリかどうか
  11. echo "link" .($i 1).":".$site.$regArr[$i][1]."
    ";//ルートディレクトリ
  12. else
  13. echo "link".($i 1).":".$base.$regArr[$i][1]."
    ";//現在のディレクトリ
  14. else
  15. echo "link".($i 1).":".$regArr[$i][1]."
    ";// 相対パス
  16. }
  17. fclose($fp);
  18. ?>
  19. フォーム:http://www.uphtm.com /php/253.html

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

HTMLの表の境界線 HTMLの表の境界線 Sep 04, 2024 pm 04:49 PM

HTML の表の境界線に関するガイド。ここでは、HTML でのテーブルの境界線の例を示しながら、テーブル境界線を定義する複数の方法について説明します。

HTML のネストされたテーブル HTML のネストされたテーブル Sep 04, 2024 pm 04:49 PM

これは、HTML でのネストされたテーブルのガイドです。ここでは、テーブル内にテーブルを作成する方法をそれぞれの例とともに説明します。

HTML 左マージン HTML 左マージン Sep 04, 2024 pm 04:48 PM

HTML マージン左のガイド。ここでは、HTML margin-left の概要とその例、およびそのコード実装について説明します。

HTML テーブルのレイアウト HTML テーブルのレイアウト Sep 04, 2024 pm 04:54 PM

HTML テーブル レイアウトのガイド。ここでは、HTML テーブル レイアウトの値と例および出力について詳しく説明します。

HTML 順序付きリスト HTML 順序付きリスト Sep 04, 2024 pm 04:43 PM

HTML 順序付きリストのガイド。ここでは、HTML 順序付きリストと型の導入とその例についても説明します。

HTML入力プレースホルダー HTML入力プレースホルダー Sep 04, 2024 pm 04:54 PM

HTML 入力プレースホルダーのガイド。ここでは、コードと出力とともに HTML 入力プレースホルダーの例について説明します。

HTML 内のテキストの移動 HTML 内のテキストの移動 Sep 04, 2024 pm 04:45 PM

HTML でのテキストの移動に関するガイド。ここでは、概要、マーキー タグが構文でどのように機能するか、および実装例について説明します。

PHPでHTML/XMLを解析および処理するにはどうすればよいですか? PHPでHTML/XMLを解析および処理するにはどうすればよいですか? Feb 07, 2025 am 11:57 AM

このチュートリアルでは、PHPを使用してXMLドキュメントを効率的に処理する方法を示しています。 XML(拡張可能なマークアップ言語)は、人間の読みやすさとマシン解析の両方に合わせて設計された多用途のテキストベースのマークアップ言語です。一般的にデータストレージに使用されます

See all articles