MongoDB MapReduce の使用法と PHP サンプル コード

WBOY
リリース: 2016-08-08 09:30:30
オリジナル
1208 人が閲覧しました
MongoDB は、mysql、sqlserver、oracle などの一般的に使用されるリレーショナル データベースの関数によるグループ化ほど便利ではありませんが、MongoDB にはグループ化を実現する 3 つの方法もあります: * Mongodb の 3 つのグループ化方法: * 1。 group (最初にフィルターしてからグループ化、シャーディングをサポートせず、データ量が制限され、効率的ではありません) * 2.mapreduce (JS エンジンに基づく、シングルスレッド実行、低効率、バックグラウンド統計などに適しています) .) * 3. 集約 (推奨) (PHP mongodb ドライバーのバージョンが 1.3.0 以上を必要とする場合は、パフォーマンスがはるかに高く、使いやすい集約を使用することをお勧めします。ただし、1.3 は現在サポートされていません)アカウント認証をサポートするモードでは、http://pecl.php.net/package/mongo から更新ログとバグを確認できます。mapreduce メソッドを見てみましょう:Mongodb 公式 Web サイトで MapReduce が紹介されています: MongoDB の Map/reduce は、データのバッチ処理や集計操作に役立ちます。これは、すべての入力がコレクションから取得され、出力がコレクションに送られるという Hadoop のようなものを使用するのと似ています。 SQL では GROUP BY が使用され、MongoDB では Map/Reduce が適切なツールです。大まかに意味します: MongoDB の Map/Reduce は主にデータのバッチ処理と集約に使用されます。これは、Hadoop を使用してデータを集約するのと似ています。 、すべての入力データはコレクションから取得され、MapReduce の後に出力されたデータもコレクションに書き込まれます。通常、SQL で Group By ステートメントを使用する方法と似ています。 MapReduce を使用するには、Map と Reduce の 2 つの関数を実装する必要があります。 Map 関数は、emit(key, value) を呼び出してコレクション内のすべてのレコードを走査し、キーと値を処理のために Reduce 関数に渡します。 Map 関数と Reduce 関数は Javascript で記述されており、db.runCommand または mapreduce コマンドを通じて MapReduce 操作を実行できます。
MapReduce コマンドは次のとおりです: db.runCommand( { mapreduce : <collection>, map : <mapfunction>, reduce : <reducefunction> [, query : <queryfilterobject>] [, sort : <sortthequery.usefulforoptimization>] [, limit : <numberofobjectstoreturnfromcollection>] [, out : <output-collectionname>] [, keeptemp: <true|false>] [, finalize : <finalizefunction>] [, scope : <objectwherefieldsgointojavascriptglobalscope >] [, verbose : true] } );

パラメータの説明:

mapreduce: 操作対象のターゲットセット

map: マッピング関数 (キーと値のシーケンスを生成します)

reduce: 統計関数

query: 対象レコードのフィルタリング

sort: 対象レコードのソート

limit: 対象レコード数の制限

out: 統計結果の保存収集(そうでない場合)指定した場合、一時コレクションを使用し、クライアント上で切断 オープン後自動削除)

keeptemp: 一時コレクションを保持するかどうか

finalize: 最終処理関数(reduce return結果を最終ソートして格納する)結果セット)

scope: マップ、リデュース、ファイナライズする外部変数をインポートします

verbose : 詳細な時間統計を表示します


map 関数
map 関数は、現在のオブジェクトを呼び出し、オブジェクトの属性を処理し、 map メソッドは、reduce する値を渡します。このメソッドは、これを使用して現在のオブジェクトを操作し、emit(at少なくとも1回のキー、値)メソッドを呼び出して、reduceするパラメータを提供します。ここで、emitのキーは最終データのIDです。
reduce函数 
接收一个值和数组,根据需要对数组进行合并分组等处理,reduce的key就是emit(key,value)的key,value_array是同个key对应的多个value数组。 
Finalize函数 
此函数为可选函数,可在执行完map和reduce后执行,对最后的数据进行统一处理。 
看完基本介绍,我们再来看一个实例:已知集合feed,测试数据如下:{ "_id": ObjectId("50ccb3f91e937e2927000004"), "feed_type": 1, "to_user": 234, "time_line": "2012-12-16 01:26:00" }{ "_id": ObjectId("50ccb3ef1e937e0727000004"), "feed_type": 8, "to_user": 123, "time_line": "2012-12-16 01:26:00" }{ "_id": ObjectId("50ccb3e31e937e0a27000003"), "feed_type": 1, "to_user": 123, "time_line": "2012-12-16 01:26:00" }{ "_id": ObjectId("50ccb3d31e937e0927000001"), "feed_type": 1, "to_user": 123, "time_line": "2012-12-16 01:26:00" }
我们按动态类型feed_type和用户to_user进行分组统计,实现结果:
feed_type to_user cout
1 234 1
8 123 1
1 123 2







实现代码://编写map函数$map = ' function() { var key = {to_user:this.to_user,feed_type:this.feed_type}; var value = {count:1}; emit(key,value); } '; //reduce 函数$reduce = ' function(key, values) { var ret = {count:0}; for(var i in values) { ret.count += 1; } return ret; }'; //查询条件$query = null; //本实例中没有查询条件,设置为null$mongo = new Mongo('mongodb://root:root@127.0.0.1: 28017/'); //链接mongodb,账号和密码为root,root$instance = $mongo->selectDB("testdb"); //执行此命令后,会创建feed_temp_res的临时集合,并将统计后的数据放在该集合中$cmd = $instance->command(array( 'mapreduce' => 'feed', 'map' => $map, 'reduce' => $reduce, 'query' => $query, 'out' => 'feed_temp_res' )); //查询临时集合中的统计数据,验证统计结果是否和预期结果一致$cursor = $instance->selectCollection('feed_temp_res')->find(); $result = array(); try { while ($cursor->hasNext()) { $result[] = $cursor->getNext(); } } catch (MongoConnectionException $e) { echo$e->getMessage(); } catch (MongoCursorTimeoutException $e) { echo$e->getMessage(); } catch(Exception$e){ echo$e->getMessage(); } //test var_dump($result);
下面是输出的结果,和预期结果一致{ "_id": { "to_user": 234, "feed_type": 1 }, "value": { "count": 1 }}{ "_id": { "to_user": 123, "feed_type": 8 }, "value": { "count": 1 }}{ "_id": { "to_user": 123, "feed_type": 1 }, "value": { "count": 2 }}
以上只是简单的统计实现,你可以实现复杂的条件统计编写复杂的reduce函数,可以增加查询条件,排序等等。附上mapReduce数据库处理函数(简单封装)/** * mapReduce分组 * * @param string $table_name 表名(要操作的目标集合名) * @param string $map 映射函数(生成键值对序列,作为 reduce 函数参数) * @param string $reduce 统计处理函数 * @param array $query 过滤条件 如:array('uid'=>123) * @param array $sort 排序 * @param number $limit 限制的目标记录数 * @param string $out 统计结果存放集合 (不指定则使用tmp_mr_res_$table_name, 1.8以上版本需指定) * @param bool $keeptemp 是否保留临时集合 * @param string $finalize 最终处理函数 (对reduce返回结果进行最终整理后存入结果集合) * @param string $scopemap、reduce、finalize 导入外部js变量 * @param bool $jsMode 是否减少执行过程中BSON和JS的转换,默认true(注:false时 BSON-->JS-->map-->BSON-->JS-->reduce-->BSON,可处理非常大的mapreduce,//true时BSON-->js-->map-->reduce-->BSON) * @param bool $verbose 是否产生更加详细的服务器日志 * @param bool $returnresult 是否返回新的结果集 * @param array &$cmdresult 返回mp命令执行结果 array("errmsg"=>"","code"=>13606,"ok"=>0) ok=1表示执行命令成功 * @return*/ function mapReduce($table_name,$map,$reduce,$query=null,$sort=null,$limit=0,$out='',$keeptemp=true,$finalize=null,$scope=null,$jsMode=true,$verbose=true,$returnresult=true,&$cmdresult){ if(empty($table_name) || empty($map) || empty($reduce)){ return null; } $map = new MongoCode($map); $reduce = new MongoCode($reduce); if(empty($out)){ $out = 'tmp_mr_res_'.$table_name; } $cmd = array( 'mapreduce' => $table_name, 'map' => $map, 'reduce' => $reduce, 'out' =>$out ); if(!empty($query) && is_array($query)){ array_push($cmd, array('query'=>$query)); } if(!empty($sort) && is_array($sort)){ array_push($cmd, array('sort'=>$query)); } if(!empty($limit) && is_int($limit) && $limit>0){ array_push($cmd, array('limit'=>$limit)); } if(!empty($keeptemp) && is_bool($keeptemp)){ array_push($cmd, array('keeptemp'=>$keeptemp)); } if(!empty($finalize)){ $finalize = new Mongocode($finalize); array_push($cmd, array('finalize'=>$finalize)); } if(!empty($scope)){ array_push($cmd, array('scope'=>$scope)); } if(!empty($jsMode) && is_bool($jsMode)){ array_push($cmd, array('jsMode'=>$jsMode)); } if(!empty($verbose) && is_bool($verbose)){ array_push($cmd, array('verbose'=>$verbose)); } $dbname = $this->curr_db_name; $cmdresult = $this->mongo->$dbname->command($cmd); if($returnresult){ if($cmdresult && $cmdresult['ok']==1){ $result = $this->find($out, array()); } } if($keeptemp==false){ //删除集合 $this->mongo->$dbname->dropCollection($out); } return$result; }
MongoDB官方网站介绍:MapReduce介绍  http://docs.mongodb.org/manual/core/map-reduce/Aggregation介绍  http://docs.mongodb.org/manual/aggregation/ 

以上就介绍了mongodb的mapreduce用法及php示例代码,包括了方面的内容,希望对PHP教程有兴趣的朋友有所帮助。

関連ラベル:
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート
私たちについて 免責事項 Sitemap
PHP中国語ウェブサイト:福祉オンライン PHP トレーニング,PHP 学習者の迅速な成長を支援します!