PHPカール同時実行のベストプラクティスコード共有-php手册-php.cn

PHPカール同時実行のベストプラクティスコード共有

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

リリース： 2016-06-13 11:58:33

オリジナル

894 人が閲覧しました

この記事では、2 つの具体的な実装方法について説明し、さまざまな方法の簡単なパフォーマンスの比較を行います。

1. 古典的な cURL 同時実行メカニズムとその既存の問題

たとえば、PHP オンラインマニュアルの次の実装方法を参照してください。

コードをコピーします。コードは次のとおりです。

コードは次のとおりです:

関数 Rolling_curl($urls, $delay) { $queue =curl_multi_init();
$map = array();

foreach ($urls として $url) {

$ ch =curl_init(); curl_setopt($ch, CURLOPT_TIMEOUT, 1); curl_setopt($ch, CURLOPT_HEADER, 0); curl_setopt($ch, CURLOPT_NOSIGNAL, true);

curl_multi_add_handle($queue, $ch); ch] = $url;
}

$responses = array();
do {
while (($code =curl_multi_exec($queue, $active)) == CURLM_CALL_MULTI_PERFORM) ;

if ($code != CURLM_OK) { Break; }

// リクエストが完了しました --
while ($done =curl_multi_info_read($queue) )) {

// リクエストで返された情報とコンテンツを取得します
$info =curl_getinfo($done['handle']);
$error =curl_error($done['handle]); ']);
$results = callback(curl_multi_getcontent ($done['handle']), $delay);
$responses[$map[(string) $done['handle']]] = コンパクト('info', 'error', 'results') ;

// 完了したばかりのカールハンドルを削除します
curl_multi_remove_handle($queue, $done['handle']); ($done['handle']);
}

// 出力のデータのブロックは、curl_multi_exec によって行われます
if ($active > 0) {
curl_multi_select($queue, 0.5);
}

} while ($active)
return $responses; >

3. 2 つの同時実装のパフォーマンス比較

改善前と後のパフォーマンス比較テストは、LINUX ホストで実行されました。テスト中に使用された同時キューは次のとおりです。次のように:

http://item.taabao.com/item.htm?id=14392877692
http://item.taobao.com/item.htm?id=16231676302
http ://item.taobao .com/item.htm?id=17037160462
http://item.taobao.com/item.htm?id=5522416710
http://item.taobao.com/item .htm?id=16551116403
http://item.taabao.com/item.htm?id=14088310973

実験計画の原則とパフォーマンステスト結果の形式を簡単に説明します。結果の信頼性を評価するには、同じインターフェイス URL セットを指定して 1 回の実験で各セットの実験を 20 回繰り返し、2 つの同時実行メカニズムの消費時間 (秒単位) を測定します。クラシック (従来の同時実行メカニズムを指します) とローリング (改善された同時実行メカニズムを参照) で最も短い時間が勝者 (Winner) となり、節約された時間 (Excellence、秒) とパフォーマンス向上率 (Excel. %) が計算されます。実験を単純に保ちながら、実際のリクエストにできるだけ近づけます。返された結果の処理では、他の複雑な操作を実行せずに、単純な正規表現のマッチングのみを実行しました。さらに、結果処理コールバックの影響を確認するために、パフォーマンス比較テストの結果を基に、usleep を使用して、実際のより信頼性の高いデータ処理ロジック (抽出、単語の分割、ファイルやデータベースへの書き込みなど) をシミュレートできます。

パフォーマンステストで使用されるコールバック関数。

コードをコピーコードは次のとおりです:

function callback($data, $delay) {
preg_match_all('/

(. )

/iU', $data, $matches);
usleep($delay);
return Compact('data', 'matches') ;
}

データ処理コールバックに遅延がない場合: Rolling Curl はわずかに向上しますが、パフォーマンスは向上します
データ処理コールバックの遅延は 5 です。ミリ秒: ローリング Curl が優先され、パフォーマンスが約 40% 向上します。
上記のパフォーマンスの比較により、同時実行量が非常に多い場合は、ローリング cURL がより適切な選択肢となるはずです。 1000)、同時キューの最大長 (20 など) を制御できます。URL が返されて処理されると、要求されていない URL がすぐにキューに追加されるため、この方法で記述されたコードはより堅牢になります。同時実行数が大きすぎても、スタックしたりクラッシュしたりすることはありません。実装の詳細については、http://code.google.com/p/rolling-curl/ を参照してください。