PHP は URL に基づいて Web ページのコンテンツを取得します。 PHP で URL に基づいて Web ページのコンテンツを取得するには、システム組み込み関数 file_get_contents() を使用して URL を渡すことができます。 Baidu の取得など、Web ページのコンテンツを返すホームページのコンテンツ コードは次のとおりです: このコードは NetEase のホームページの完全なコードを取得できないため、返されます。次のページを参照してください。現時点では、他の方法もあります。 ここでは、 が簡単かつ効果的に Web ページをキャプチャできる php の cURL ライブラリを紹介します。スクリプトを実行して、クロールした Web ページを分析するだけで、必要なデータをプログラムで取得できます。リンクから部分データを取得する場合でも、XML ファイルを取得してデータベースにインポートする場合でも、単に Web ページのコンテンツを取得する場合でも、cURL は強力な PHP ライブラリ です。 これを使用するには、まず php 設定ファイルで有効にする必要があります。これを開くときに、Windows でいくつかの DLL が必要になる場合があります。ここでの紹介は信じられません。 phpinfo() を呼び出して確認できます。オンになっている場合は、「読み込まれた拡張機能」に表示されます。 次に、curl を使用して Web ページのコードを取得する簡単な例を示します。 このコードを通じて NetEase ホームページのコンテンツを出力できます。ここで赤くマークされたコードがキーです。ブラウザのエージェントが使用されるため、サーバーはブラウザによってアクセスされたと認識し、正しい HTML を返します。
<?php$html = file_get_contents('http://www.baidu.com/');echo $html;
Baidu ホームページのコンテンツを表示します。ただし、一部のサーバーではこの関数が無効になるため、または必要なパラメーターがサーバーに渡されなかったためにこの関数が拒否されたため、この関数は全能ではありません。たとえば、<🎜。 ><?php$html = file_get_contents('http://www.163.com/');echo $html;
<?php$ch = curl_init();$timeout = 10; // set to zero for no timeoutcurl_setopt ($ch, CURLOPT_URL,'http://www.163.com/');curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1); <span style="color:#990000;">curl_setopt ($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/34.0.1847.131 Safari/537.36');</span>curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT, $timeout);$html = curl_exec($ch);echo $html;