option可以是下面几个选项:
{ inline : 1 } – 不会创建collection,结果保存在内存里,只限于结果小于16MB的情况
如果用collection name作option不能与其它option一起使用,其它则可以,如:
merge选项的可能性最大,但是经过实验发现,它总是会根据“_id”更新整个文档,而不是只更新reduce或者finalize出来的对象里有的字段。
比如我一个已经存在的集合A,有10几个字段,没有emps字段,我运行一个MR操作,reduce出来的是{key,emps:[["0132",70],["1443",30]]},想把emps字段添加到现有的集合A上,结果我10几个字段都没有了,就只剩下emps字段了。
本来想在reduce里引用db对象手工update的,但是现在的版本都不让引用db对象了。
现在只能在mapreduce后,执行一个forEach,手工执行update。
请问mapreduce有没有相应的解决方案。
Utilisez
reduce
, il calculera les résultats existants et les résultats nouvellement calculés dans l'ensemble de résultats en utilisant la fonction de réduction (réducteur) que vous avez fournie. Le résultat final est enregistré. La chose la plus importante ici est de faire en sorte que les résultats intermédiaires générés par le mappeur aient le même format que les résultats finaux. Un tel réducteur est utilisé à deux endroits, une fois en réduction et une fois en sortie. S'ils ont le même format, notamment la hiérarchie, ce sera beaucoup plus facile à écrire. Le réducteur peut être compris comme étant uniquement responsable de la fusion de plusieurs résultats. Si le mappeur ne génère qu'un résultat intermédiaire, il doit être directement utilisé comme résultat final sans passer par le réducteur. En effet, dans MongoDB, lorsqu'une clé correspond à une seule sortie du mappeur, elle est bien sortie directement sans passer par le réducteur.http://docs.mongodb.org/manual/reference/method/db.collection.mapReduce/#output-to-a-collection-with-an-action