ホームページ > バックエンド開発 > PHPチュートリアル > カールに関するいくつかの小さな問題

カールに関するいくつかの小さな問題

WBOY
リリース: 2016-06-23 13:51:40
オリジナル
998 人が閲覧しました

最新のデータを取得するためにcurlを使用するにはどうすればよいですか?
たとえば、Web サイトのすべての情報をクロールし、その後 Web サイトが更新された場合、クロールを繰り返さずに更新されたアイテムをクロールするにはどうすればよいでしょうか?


ディスカッション (解決策) への返信

クロール後、ローカル データベースに保存します。次に、最新のパターンにどのようなパターンがあるかを調べます。区別できる場合は、以前のローカル データベースを変更します。本当に違いがない場合は、キャプチャしたデータをすべて一度保存します。保存が成功した場合は、前のデータをクリーンアップするだけです。

それが新しいかどうかは、見たときにのみわかります

curl は CURLOPT_WRITEFUNCTION 属性を使用します
コールバック関数でクロールが早期に終了できるかどうかを判断できます

ああ、データベース内の最大の ID を取得し、取得しますそのメッセージの ID は、Web ページによって取得された ID が、データベースから取得された最新の ID よりも大きくなります。
しかし、この方法では、すべてのデータを一度に判断する必要はありません。効率が非常に低くなりませんか?

わかりました、この時間は無視して構いません、投稿してくれてありがとう

関連ラベル:
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート