PHPでリダイレクトされたWebページのソースコードを読む方法
PHP は、開発者が動的な Web アプリケーションを作成するのに役立つ、広く使用されているサーバーサイド スクリプト言語です。ただし、PHP 開発者は、ジャンプ リンクである可能性のある外部 Web ページのソース コードを読み取る必要がある場合があります。この記事では、PHP を使用してリダイレクト リンクのソース コードを読み取る方法を学びます。
注: この記事では、読者がすでに PHP 言語に精通しており、HTML および HTTP プロトコルの基本を理解していることを前提としています。
ステップ 1: cURL を使用してリンクを開く
cURL は、PHP で URL を処理するために使用されるライブラリです。リンクされた Web ページのソース コードを読み取るには、cURL を使用してリンクを開く必要があります。以下は、cURL を使用して PHP で Web ページを開くための基本的なコードです:
$url = 'http://www.example.com'; $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); $output = curl_exec($ch); curl_close($ch);
上記のコードでは、最初に読み取る Web ページのリンク アドレスを定義し、次に cURL ハンドルを作成し、アクセスリンクオプションを指定してcURLリクエストを送信し、応答結果を取得します。結果は $output 変数に保存されます。
ステップ 2: ジャンプ リンクを処理する
場合によっては、開いたリンクがジャンプ リンクである可能性があります。これは、別のリンクにリダイレクトされることを意味します。リダイレクトされた Web ページのソース コードを取得するには、応答ヘッダー情報をチェックして、Location ヘッダーがあるかどうかを判断する必要があります。存在する場合、これはジャンプ リンクであることを意味し、リダイレクトされたリンクのアドレスは Location に格納されます。ソース コードを取得するには、cURL を使用してこのリダイレクトされたリンクを開いてください。
以下はコード例です:
$url = 'http://www.example.com'; $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true); $output = curl_exec($ch); $info = curl_getinfo($ch); curl_close($ch); if ($info['http_code'] == 301 || $info['http_code'] == 302) { $url = $info['redirect_url']; $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); $output = curl_exec($ch); curl_close($ch); }
上記のコードでは、curl_setopt オプション: CURLOPT_FOLLOWLOCATION を追加しました。このオプションは、cURL にリダイレクトに従い、新しいリンクを自動的に開くように指示します。次に、レスポンスヘッダ情報を取得し、リダイレクト情報があるかどうかを判断します。存在する場合は、curl_init() 関数を使用して新しい cURL ハンドルを作成し、リダイレクト リンクを開いて、ソース コードを取得します。
ステップ 3: ソース コードを解析する
Web ページのソース コードを取得したら、データを処理できるようにさらに解析する必要があります。 PHP の組み込み DOMDocument クラスを使用して HTML ドキュメントを解析できます。
以下はコード例です:
$url = 'http://www.example.com'; $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true); $output = curl_exec($ch); $info = curl_getinfo($ch); curl_close($ch); if ($info['http_code'] == 301 || $info['http_code'] == 302) { $url = $info['redirect_url']; $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); $output = curl_exec($ch); curl_close($ch); } $doc = new DOMDocument(); @$doc->loadHTML($output); $elements = $doc->getElementsByTagName('html'); $title = $doc->getElementsByTagName('title')->item(0)->nodeValue;
上記のコードでは、最初に DOMDocument オブジェクトを作成し、次に、loadHTML() 関数を呼び出して、取得した Web ページのソース コードを次のように渡します。パラメータ。次に、getElementsByTagName() 関数を使用して指定された要素を取得し、nodeValue 属性を使用して要素のテキスト コンテンツを取得します。この例では、HTML 要素と title 要素を取得します。
ステップ 4: データを処理する
最後に、取得したデータを処理し、必要に応じて保存または表示できます。以下は簡単な例です。
$url = 'http://www.example.com'; $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true); $output = curl_exec($ch); $info = curl_getinfo($ch); curl_close($ch); if ($info['http_code'] == 301 || $info['http_code'] == 302) { $url = $info['redirect_url']; $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); $output = curl_exec($ch); curl_close($ch); } $doc = new DOMDocument(); @$doc->loadHTML($output); $title = $doc->getElementsByTagName('title')->item(0)->nodeValue; echo "源码标题是:" . $title . "\n"; echo "HTML源码是:" . $output;
上記のコードでは、最初に Web ページのタイトルを取得し、次に HTML ソース コードを直接出力します。
結論
この記事では、PHP を使用してリダイレクトされた Web ページのソース コードを読み取る方法を学びました。 cURL を使用してリンクを開いたり、ジャンプ リンクを処理したり、HTML ドキュメントを解析したり、データを処理したりすることで、ジャンプ リンクの Web ページのソース コードを簡単に読み取ることができます。これは、Web クローラー、データ分析、データ マイニング、その他のシナリオを使用する必要がある場合に非常に便利なスキルです。
以上がPHPでリダイレクトされたWebページのソースコードを読む方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











この記事では、PHPおよび緩和戦略におけるOWASPトップ10の脆弱性について説明します。重要な問題には、PHPアプリケーションを監視および保護するための推奨ツールを備えたインジェクション、認証の壊れ、XSSが含まれます。

PHP 8のJITコンピレーションは、頻繁に実行されるコードをマシンコードにコンパイルし、重い計算でアプリケーションに利益をもたらし、実行時間を短縮することにより、パフォーマンスを向上させます。

この記事では、コードインジェクションのような脆弱性を防ぐために、PHPファイルのアップロードを確保することについて説明します。ファイルタイプの検証、セキュアストレージ、およびアプリケーションセキュリティを強化するエラー処理に焦点を当てています。

この記事では、PHPの対称的および非対称暗号化について説明し、適合性、パフォーマンス、セキュリティの違いを比較しています。対称暗号化はより速く、バルクデータに適していますが、非対称は安全なキー交換に使用されます。

この記事では、不正アクセスを防ぎ、ベストプラクティスの詳細、セキュリティ強化ツールの推奨を防ぐために、PHPで堅牢な認証と承認の実装について説明します。

この記事では、CSRFトークン、同じサイトCookie、適切なセッション管理など、PHPでのCSRF攻撃を防ぐための戦略について説明します。

この記事では、Token BucketやLeaky BucketなどのアルゴリズムやSymfony/Rate-Limiterなどのライブラリを使用するなど、PHPでAPIレート制限を実装するための戦略について説明します。また、監視、動的に調整されたレートの制限、および手をカバーします

記事では、組み込み関数、ホワイトリストアプローチ、サーバー側の検証などの手法に焦点を当てたセキュリティを強化するためのPHP入力検証のベストプラクティスについて説明します。
