今日は、PHP を使用して Web ページにアクセスし、そのコンテンツをローカル ファイルに保存する方法を学びます。このスキルは、クロールやデータ分析に非常に役立ちます。
まず、PHP のcurl 関数を使用して Web ページのコンテンツを取得する必要があります。 curl は、ネットワークにアクセスするために使用できるライブラリであり、HTTP、FTP、SMTP などの複数のプロトコルをサポートできます。
まず、get_html.php という名前のサンプル ファイルを作成し、次のコードをファイルに追加します。
<?php // 获取网址 $url = 'http://www.example.com'; // 初始化 curl $ch = curl_init(); // 设置参数 curl_setopt($ch, CURLOPT_URL, $url); // 设置访问的 URL curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); // 将结果返回而不显示 curl_setopt($ch, CURLOPT_HEADER, false); // 不返回头信息 // 发送请求 $result = curl_exec($ch); // 关闭 curl curl_close($ch); // 打印结果 echo $result; ?>
上記のコードでは、最初に URL を定義します。次に、curl_init() 関数でcurlを初期化します。次に、アクセスした URL、結果を表示せずに返す、ヘッダー情報を返さないなど、上記のパラメータの一部を設定します。最後に、curl_exec() 関数を使用してリクエストを実行し、結果を $result 変数に保存します。最後に、$result 変数の値を出力して、この Web ページのコンテンツを確認します。
次に、Web ページのコンテンツをローカル ファイルに保存する必要があります。 file_put_contents() 関数を使用すると、文字列の内容をファイルに直接書き込むことができます。最初にファイルを作成してから、そのファイルにコンテンツを保存する必要があることに注意することが重要です。
<?php // 获取网址 $url = 'http://www.example.com'; // 初始化 curl $ch = curl_init(); // 设置参数 curl_setopt($ch, CURLOPT_URL, $url); // 设置访问的 URL curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); // 将结果返回而不显示 curl_setopt($ch, CURLOPT_HEADER, false); // 不返回头信息 // 发送请求 $result = curl_exec($ch); // 关闭 curl curl_close($ch); // 将结果保存到文件中 $file = 'page.html'; file_put_contents($file, $result); ?>
上記のコードでは、まずアクセスする URL を定義し、次に、curl_init() 関数を使用してcurl を初期化し、いくつかのパラメータを設定します。次に、リクエストを実行し、結果を $result 変数に保存します。最後に、file_put_contents() 関数を使用して、$result 変数の値を page.html というファイルに保存します。
さて、PHP を使用して Web ページにアクセスし、そのコンテンツをファイルに保存する方法を学習しました。これはデータスクレイピングと分析の基本的なスキルですので、この記事があなたのお役に立てば幸いです。
以上がPHP を使用して Web ページにアクセスし、そのコンテンツをファイルに保存しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。