Curl マルチスレッドの例と原則を紹介します。私が間違っていたら教えてください
PHP マニュアルでは不明瞭なcurl_multi関数ファミリーについて多くの人が頭を悩ませていると思います。ドキュメントはほとんどなく、与えられた例は非常に単純なのでそこから学ぶ方法はありません。 . 私も多くの Web ページを検索しましたが、完全なアプリケーション例は見つかりませんでした。
curl_multi_add_handle
curl_multi_close
curl_multi_exec
curl_multi_getcontent
curl_multi_info_read
curl_multi_init
curl_multi_remove_handle
curl_multi_select
一般的に、これらの関数の使用を考えるとき、その目的は明らかに複数の URL を 1 つずつリクエストするのではなく、同時にリクエストする必要があります。それ以外の場合は、自分でループする方が良いでしょう。curl_exec を調整するだけです。
ステップは次のように要約されます:
ステップ 1:curl_multi_init を呼び出す
ステップ 2:ループ内でcurl_multi_add_handleを呼び出す
このステップで注意すべき点は、curl_multi_add_handle の 2 番目のパラメーターがcurl_init のサブハンドルであることです。
ステップ 3:curl_multi_exec を継続的に呼び出します
ステップ 4:curl_multi_getcontent をループ内で呼び出して、必要に応じて結果を取得します
ステップ 5:curl_multi_remove_handle を呼び出し、単語ハンドルごとにcurl_close を呼び出します
ステップ 6:curl_multi_close を呼び出します
PHP マニュアルは次のとおりです。
動作が非常に安定しています。
同時実行数を設定すると、常にこの同時実行数で作業することになります。コールバック関数を通じてタスクを追加した場合でも、影響を受けません。
CPU 使用率は非常に低く、CPU のほとんどはユーザーのコールバック関数で消費されます。
高いメモリ使用量と多数のタスク (15W のタスクは 256M 以上のメモリを占有します) コールバック関数を使用してタスクを追加でき、その数はカスタマイズされます。
帯域幅を最大限に占有することができます。
複数の異なるアドレスからデータを収集する必要があるタスクなどの連鎖タスクは、コールバックを使用して一度に完了できます。
CURLエラーを複数回試行可能、回数はカスタマイズ可能(同時実行数が多いため最初はCURLエラーが発生しやすく、ネットワーク状況や相手の安定性によってもCURLエラーが発生する可能性があります)サーバ)。
コールバック関数は非常に柔軟で、複数の種類のタスクを同時に実行できます (たとえば、ファイルのダウンロード、Web ページのクローリング、404 の分析を 1 つの PHP プロセスで同時に実行できます)。
404のチェック、リダイレクトの最後のURLの取得など、タスクの種類をカスタマイズするのは非常に簡単です。
製品の完全性を試すためにキャッシュを設定できます。
デメリット:
マルチコアCPUを最大限に活用できない(問題を解決するために複数のプロセスを開いてしまう可能性がある、タスク分割などのロジックを自分で処理する必要がある)。
テスト後の最大同時実行数は 500 (または 512?) で、最大同時実行数を超えると常に失敗します。
現時点ではレジューム機能はありません。
現在のタスクはアトミックであるため、大きなファイルをいくつかの部分に分割し、個別のスレッドを開いてダウンロードすることはできません。