ホームページ > バックエンド開発 > PHPチュートリアル > phpはURLに基​​づいてWebコンテンツを取得します

phpはURLに基​​づいてWebコンテンツを取得します

WBOY
リリース: 2016-06-13 12:03:15
オリジナル
876 人が閲覧しました

PHP は URL

に基づいて Web ページのコンテンツを取得します。 PHP で URL に基づいて Web ページのコンテンツを取得するには、システム組み込み関数 file_get_contents() を使用して URL を渡すことができます。 Baidu の取得など、Web ページのコンテンツを返すホームページのコンテンツ コードは次のとおりです:

<?php$html = file_get_contents(&#39;http://www.baidu.com/&#39;);echo $html;
ログイン後にコピー

Baidu ホームページのコンテンツを表示します。ただし、一部のサーバーではこの関数が無効になるため、または必要なパラメーターがサーバーに渡されなかったためにこの関数が拒否されたため、この関数は全能ではありません。たとえば、

<🎜。 >


<?php$html = file_get_contents(&#39;http://www.163.com/&#39;);echo $html;
ログイン後にコピー

このコードは NetEase のホームページの完全なコードを取得できないため、返されます。次のページを参照してください。現時点では、他の方法もあります。



ここでは、 が簡単かつ効果的に Web ページをキャプチャできる php の cURL ライブラリを紹介します。スクリプトを実行して、クロールした Web ページを分析するだけで、必要なデータをプログラムで取得できます。リンクから部分データを取得する場合でも、XML ファイルを取得してデータベースにインポートする場合でも、単に Web ページのコンテンツを取得する場合でも、cURL は強力な PHP ライブラリ です。 これを使用するには、まず php 設定ファイルで有効にする必要があります。これを開くときに、Windows でいくつかの DLL が必要になる場合があります。ここでの紹介は信じられません。 phpinfo() を呼び出して確認できます。オンになっている場合は、「読み込まれた拡張機能」に表示されます。


次に、curl を使用して Web ページのコードを取得する簡単な例を示します。

<?php$ch = curl_init();$timeout = 10; // set to zero for no timeoutcurl_setopt ($ch, CURLOPT_URL,&#39;http://www.163.com/&#39;);curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1); <span style="color:#990000;">curl_setopt ($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/34.0.1847.131 Safari/537.36');</span>curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT, $timeout);$html = curl_exec($ch);echo $html;
ログイン後にコピー

このコードを通じて NetEase ホームページのコンテンツを出力できます。ここで赤くマークされたコードがキーです。ブラウザのエージェントが使用されるため、サーバーはブラウザによってアクセスされたと認識し、正しい HTML を返します。



関連ラベル:
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート