Mongodb中数据聚合之MapReduce
Mongodb是针对大数据量环境下诞生的用于保存大数据量的非关系型数据库,针对大量的数据,如何进行统计操作至关重要,那么如何从Mongodb中统计一些数据呢? 在Mongodb中,给我们提供了三种用于数据聚合的方式: (1)简单的用户聚合函数; (2)使用aggregate
Mongodb是针对大数据量环境下诞生的用于保存大数据量的非关系型数据库,针对大量的数据,如何进行统计操作至关重要,那么如何从Mongodb中统计一些数据呢?
在Mongodb中,给我们提供了三种用于数据聚合的方式:
(1)简单的用户聚合函数;
(2)使用aggregate进行统计;
(3)使用mapReduce进行统计;
今天我们首先来讲讲mapReduce是如何统计,在后续的文章中,将另起文章进行相关说明。
MapReduce是啥呢?以我的理解,其实就是对集合中的各个满足条件的文档进行预处理,整理出想要的数据然后进行统计得到最终的统计结果。其中map函数用于对集合中的各个满足条件的文档进行预处理,整理出想要的数据。Reduce函数用于对整理出的数据进行处理得到统计结果。Map函数和Reduce函数都是JavaScript函数。
首先,我们先构造一个测试数据集test,使用js脚本往集合中随机插入一组数据,每条记录是哪个人花了多少钱买了什么东西。具体脚本test1.js如下:
<span style="font-size:18px;">for( var i=0; i=3 && rID=5 && rID</span>
接下来我们通过在控制台执行脚本来向数据库插入具体的数据,具体执行指令如下:
<span style="font-size:18px;">mongo 127.0.0.1:27017/test J:/test1.js</span>
执行之后,通过MongoVUE来查看下具体的数据,如下所示,数据已经插入到集合中了:
接下来,我们可以做几个简单的统计操作了。
(1)统计不同用户都买了多少个商品?编写js脚本test2.js,将结果保存到statis1集合中。
<span style="font-size:18px;"><span style="font-size:18px;">map=function(){ emit(this.user,1); } reduce=function(key, values){ var count = 0; values.forEach(function(val){count += val}); return count; } db.test.mapReduce(map, reduce, {out:"statics1"});</span></span>
按照刚才执行脚本的方式执行test2.js,并查看数据:

从数据库就可以直观看到统计数据了,若想查看某个人如majing购买了多少个商品,直接使用
<span style="font-size:18px;"><span style="font-size:18px;"><span style="font-family:KaiTi_GB2312;font-size:18px;">db.statics1.find({"_id":"majing"});</span></span></span>
脚本test3.js如下所示:
<span style="font-size:18px;"><span style="font-size:18px;">map=function(){ emit({user:this.user,sku:this.sku},1); } reduce=function(key, values){ var count = 0; values.forEach(function(val){count += val}); return count; } db.test.mapReduce(map, reduce, {out:"statics2"});</span></span>
总共返回了10条记录。此时如果我们想查找某个用户购买商品的情况,可以使用下面的查询方法:
<span style="font-size:18px;"><span style="font-size:18px;">db.statics2.find({"_id.user":"majing"});</span></span>

如果我们想查找某个用户购买某个商品的情况,可以使用下面的查询方法:
(3)统计每个用户购买商品的总量及花费的总金额
脚本test4.js如下所示:
<span style="font-size:18px;"><span style="font-size:18px;">map=function(){ emit({user:this.user},{totalprice:this.price,count:1}); } reduce=function(key, values){ var res = {totalprice:0.00,count:1}; values.forEach(function(val){res.totalprice += val.totalprice;res.count+=val.count;}); return res; } db.test.mapReduce(map, reduce, {out:"statics3"});</span></span>
按照刚才执行脚本的方式执行test4.js,并查看数据:

(4)统计每个用户购买商品的平均价钱
在这个情景下,我们需要用到说道mapReduce里的另一个参数finalize,该参数是一个javascript脚本函数,用于对reduce后的集合进行一个后期处理操作。
执行脚本test5.js,具体如下所示:
<span style="font-size:18px;"><span style="font-size:18px;">map=function(){ emit({user:this.user},{totalprice:this.price,count:1}); } reduce=function(key, values){ var res = {totalprice:0.00,count:1,average:0}; values.forEach(function(val){res.totalprice += val.totalprice;res.count+=val.count;}); return res; } finalizeFunc=function(key,reduceResult){ reduceResult.totalprice=(reduceResult.totalprice).toFixed(2); reduceResult.average=(reduceResult.totalprice/reduceResult.count).toFixed(2); return reduceResult; } db.test.mapReduce(map, reduce, {out:"statics4",finalize:finalizeFunc});</span></span>
执行之后查看得到的数据,具体如下所示,显示了总价钱,商品数量和商品单价。
如果想查找某个人的,可以和上面的查询方法一样,使用find()方法进行查询:
<span style="font-size:18px;"><span style="font-size:18px;">db.statics4.find({"_id.user":"majing"});</span></span>
以上通过4个简单的例子对Mongodb中的MapReduce进行了简单的说明,当然MapReduce功能很强大,大家如果想知道其他高级的使用方法,可以到Mongodb的官网进行查阅和学习,网址为 https://docs.mongodb.com/manual/reference/method/db.collection.mapReduce/ ,谢谢。

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

推荐使用 MongoDB 最新版本(当前为 5.0),因为它提供了最新特性和改进。选择版本时,需考虑功能需求、兼容性、稳定性和社区支持,例如:最新版本具有事务、聚合管道优化等特性。确保版本与应用程序兼容。生产环境选择长期支持版本。最新版本有更活跃的社区支持。

Node.js 是一种服务器端 JavaScript 运行时,而 Vue.js 是一个客户端 JavaScript 框架,用于创建交互式用户界面。Node.js 用于服务器端开发,如后端服务 API 开发和数据处理,而 Vue.js 用于客户端开发,如单页面应用程序和响应式用户界面。

在iPhone上面临滞后,缓慢的移动数据连接?通常,手机上蜂窝互联网的强度取决于几个因素,例如区域、蜂窝网络类型、漫游类型等。您可以采取一些措施来获得更快、更可靠的蜂窝互联网连接。修复1–强制重启iPhone有时,强制重启设备只会重置许多内容,包括蜂窝网络连接。步骤1–只需按一次音量调高键并松开即可。接下来,按降低音量键并再次释放它。步骤2–该过程的下一部分是按住右侧的按钮。让iPhone完成重启。启用蜂窝数据并检查网络速度。再次检查修复2–更改数据模式虽然5G提供了更好的网络速度,但在信号较弱

哭死啊,全球狂炼大模型,一互联网的数据不够用,根本不够用。训练模型搞得跟《饥饿游戏》似的,全球AI研究者,都在苦恼怎么才能喂饱这群数据大胃王。尤其在多模态任务中,这一问题尤为突出。一筹莫展之际,来自人大系的初创团队,用自家的新模型,率先在国内把“模型生成数据自己喂自己”变成了现实。而且还是理解侧和生成侧双管齐下,两侧都能生成高质量、多模态的新数据,对模型本身进行数据反哺。模型是啥?中关村论坛上刚刚露面的多模态大模型Awaker1.0。团队是谁?智子引擎。由人大高瓴人工智能学院博士生高一钊创立,高

最近,军事圈被这个消息刷屏了:美军的战斗机,已经能由AI完成全自动空战了。是的,就在最近,美军的AI战斗机首次公开,揭开了神秘面纱。这架战斗机的全名是可变稳定性飞行模拟器测试飞机(VISTA),由美空军部长亲自搭乘,模拟了一对一的空战。5月2日,美国空军部长FrankKendall在Edwards空军基地驾驶X-62AVISTA升空注意,在一小时的飞行中,所有飞行动作都由AI自主完成!Kendall表示——在过去的几十年中,我们一直在思考自主空对空作战的无限潜力,但它始终显得遥不可及。然而如今,

特斯拉机器人Optimus最新视频出炉,已经可以在厂子里打工了。正常速度下,它分拣电池(特斯拉的4680电池)是这样的:官方还放出了20倍速下的样子——在小小的“工位”上,拣啊拣啊拣:这次放出的视频亮点之一在于Optimus在厂子里完成这项工作,是完全自主的,全程没有人为的干预。并且在Optimus的视角之下,它还可以把放歪了的电池重新捡起来放置,主打一个自动纠错:对于Optimus的手,英伟达科学家JimFan给出了高度的评价:Optimus的手是全球五指机器人里最灵巧的之一。它的手不仅有触觉

FP8和更低的浮点数量化精度,不再是H100的“专利”了!老黄想让大家用INT8/INT4,微软DeepSpeed团队在没有英伟达官方支持的条件下,硬生生在A100上跑起FP6。测试结果表明,新方法TC-FPx在A100上的FP6量化,速度接近甚至偶尔超过INT4,而且拥有比后者更高的精度。在此基础之上,还有端到端的大模型支持,目前已经开源并集成到了DeepSpeed等深度学习推理框架中。这一成果对大模型的加速效果也是立竿见影——在这种框架下用单卡跑Llama,吞吐量比双卡还要高2.65倍。一名

2024QS世界大学学科排名来了!总体和23年变化不大。根据官网信息,2024QS世界大学学科排名涵盖了55个细分学科和5大学术领域。共有1559所高校参与了排名,其中64所高校是今年的新面孔(也就是说2023年的排名中没有出现)。而在这64所高校中,又有14所是真真正正第一次出现的。其中就包含了中国科学院大学。据精分学科来说,音乐(Music)是今年推出的新科目。此外,数据科学和人工智能排名得到了扩充,排名新加入了51所高校。总榜排名总榜前五名分别是:麻省理工学院、剑桥大学、牛津大学、哈佛大学
