mongodbmapreduce使用总结
大家都知道,mongodb是一个非关系型数据库,也就是说,mongodb数据库中的每张表是独立存在的,表与表之间没有任何依赖关系。在mongodb中,除了各种CRUD语句之外,还给我们提供了聚合和mapreduce统计的功能,这篇文章主要来跟大家聊聊mongodb的mapreduce的操
大家都知道,mongodb是一个非关系型数据库,也就是说,mongodb数据库中的每张表是独立存在的,表与表之间没有任何依赖关系。在mongodb中,除了各种CRUD语句之外,还给我们提供了聚合和mapreduce统计的功能,这篇文章主要来跟大家聊聊mongodb的mapreduce的操作。
mapreduce的概念我就不赘述了,大家自己去查查吧。
在mongodb中,mapreduce的语法如下:
db.table.mapReduce( map, reduce, { query: query, out: out, //指定结果集以什么方式存储,可选参数包括: //replace:如果文档(table)存在,则替换table, //merge:如果文档中存在记录,则覆盖已存在的文档记录 //reduce: 如果文档中存在相同key的记录了,则先计算两条记录,然后覆盖旧记录 // {inline:1} 在内存中存储记录,不写入磁盘(用户数据量少的计算) sort: sort, limit: limit, finalize: function //这个function主要用来在存入out之前可以修改数据,function(key,values) { //return modifiedValues;} scope: document, //指定reduce可访问的文档范围 jsMode:boolean //指定是否在map和ruduce之间立即将数据转换为Bason格式,默认为false //如果想设置为true,则要记住官方我那当的注意事项: //You can only use jsMode for result sets with fewer than //500,000 distinct key arguments to the mapper’s emit()function. verbose:boolean //是否在结果集中包含timing信息,默认是包含的 } )
在做mongodb的mapreduce时,要确保你的query是可以利用到索引的,不然在大数据量的统计下,将会托夸整个数据库,如果确实没办法建索引,那么就在结果集中判断一些不符合条件的数据,而去掉query。
mapreduce的语法其实很简单,只不过这里面有几点需要注意一下:
1.在map中,mongodb是每1000条数据就reduce一次
2.在map中,如果你想统计一个数据之和,需要这样写:
emit(key:this.key,sum:0})
然后再在reduce里需要将上一次的sum迭代累加起来,然后return {sum:sum};如果不这样做,你计算出来的数据总是最后不足1000条数据之后统计出来的,而前面的数据就都丢失了。
3.如果能不用mapreduce,就不用,程序能够统计的,就不要用mongodb频繁统计。
4.mapreduce的结果集的数据格式是:{_id:key,value:{}},因此如果想直接使用这个表的话,最好再重新将数据格式整理一次,尽量将数据放在最上次,而不是再用value.xxx去查询。
这里附上统计我们网站的用户发表内容的数量的mapreduce,仅供一种代码格式的参考价值吧:
var db = connect('127.0.0.1:27017/test'); db.aAccounttemp.drop(); var map = function() { emit(this.accountId, {sum:0, reblogFlag:this.reblogFlag,dashboardFlag:this.dashboardFlag,dashboardType:this.dashboardType, photoNum:0,postNum:0,reblogNum:0,videoNum:0,videoShortNum:0, musicNum:0, questionNum:0,appNum:0, dialogNum:0}); } var reduce = function(key,values) { var sum = 0; var photoNum = 0; var postNum = 0; var reblogNum = 0; var videoNum = 0; var videoShortNum = 0; var musicNum = 0; var questionNum = 0; var appNum = 0; var dialogNum = 0; for (var i = 0; i < values.length; i++) { var data = values[i]; var reblogFlag = data.reblogFlag; var dashboardFlag = data.dashboardFlag; var dashboardType = data.dashboardType; sum += data.sum; photoNum += data.photoNum; reblogNum += data.reblogNum; postNum += data.postNum; videoNum += data.videoNum; musicNum += data.musicNum; videoShortNum += data.videoShortNum; questionNum += data.questionNum; appNum += data.appNum; dialogNum += data.dialogNum; if(!reblogFlag) { if(dashboardFlag) { sum += 1; if(dashboardType == 10) { postNum += 1; } else if(dashboardType == 20) { photoNum += 1; } else if(dashboardType == 30) { videoNum += 1; } else if(dashboardType == 31) { videoShortNum += 1; } else if(dashboardType == 40) { musicNum += 1; } else if(dashboardType == 60) { questionNum += 1; } else if(dashboardType == 100) { appNum += 1; } else if(dashboardType == 91) { dialogNum += 1; } } else { if(dashboardType == 20) { photoNum += 1; } } } else if(reblogFlag && dashboardFlag) { reblogNum += 1; } } return {sum:NumberInt(sum),reblogNum:NumberInt(reblogNum),postNum:NumberInt(postNum),photoNum:NumberInt(photoNum), videoNum:NumberInt(videoNum),videoShortNum:NumberInt(videoShortNum), musicNum:NumberInt(musicNum), questionNum:NumberInt(questionNum),appNum:NumberInt(appNum),dialogNum:NumberInt(dialogNum)}; }; db.getMongo().setSlaveOk(); db.dashboard_basic.mapReduce( map, reduce, { out:{merge:'aAccounttemp'} } ); var results = db.aAccounttemp.find(); //重新整理数据格式,存入正规表中 while (results.hasNext()) { var obj = results.next(); var value = obj.value; var sum = NumberInt(value.sum); var reblogNum = NumberInt(value.reblogNum); var postNum = NumberInt(value.postNum); var photoNum = NumberInt(value.photoNum); var videoNum = NumberInt(value.videoNum); var videoShortNum = NumberInt(value.videoShortNum); var musicNum = NumberInt(value.musicNum); var questionNum = NumberInt(value.questionNum); var appNum = NumberInt(value.appNum); var dialogNum = NumberInt(value.dialogNum); var accountId = obj._id; db.dashboard_account_num.insert({accountId:accountId,sum:sum,reblogNum:reblogNum,postNum:postNum,photoNum:photoNum, videoShortNum:videoShortNum,videoNum:videoNum,musicNum:musicNum,questionNum:questionNum, appNum:appNum,dialogNum:dialogNum}); } print('success insert total ' + results.count()+ ' datas'); db.aAccounttemp.drop() quit()

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

磁力链接是一种用于下载资源的链接方式,相比传统的下载方式更为便捷和高效。使用磁力链接可以通过点对点的方式下载资源,而不需要依赖中介服务器。本文将介绍磁力链接的使用方法及注意事项。一、什么是磁力链接磁力链接是一种基于P2P(Peer-to-Peer)协议的下载方式。通过磁力链接,用户可以直接连接到资源的发布者,从而完成资源的共享和下载。与传统的下载方式相比,磁

mdf文件和mds文件怎么用随着计算机技术的不断进步,我们可以通过多种方式来存储和共享数据。在数字媒体领域,我们经常会遇到一些特殊的文件格式。在这篇文章中,我们将讨论一种常见的文件格式——mdf和mds文件,并介绍它们的使用方法。首先,我们需要了解mdf文件和mds文件的含义。mdf是CD/DVD镜像文件的扩展名,而mds文件则是mdf文件的元数据文件。

CrystalDiskMark是一款适用于硬盘的小型HDD基准测试工具,可以快速测量顺序和随机读/写速度。接下来就让小编为大家介绍一下CrystalDiskMark,以及crystaldiskmark如何使用吧~一、CrystalDiskMark介绍CrystalDiskMark是一款广泛使用的磁盘性能测试工具,用于评估机械硬盘和固态硬盘(SSD)的读写速度和随机I/O性能。它是一款免费的Windows应用程序,并提供用户友好的界面和各种测试模式来评估硬盘驱动器性能的不同方面,并被广泛用于硬件评

foobar2000是一款能随时收听音乐资源的软件,各种音乐无损音质带给你,增强版本的音乐播放器,让你得到更全更舒适的音乐体验,它的设计理念是将电脑端的高级音频播放器移植到手机上,提供更加便捷高效的音乐播放体验,界面设计简洁明了易于使用它采用了极简的设计风格,没有过多的装饰和繁琐的操作能够快速上手,同时还支持多种皮肤和主题,根据自己的喜好进行个性化设置,打造专属的音乐播放器支持多种音频格式的播放,它还支持音频增益功能根据自己的听力情况调整音量大小,避免过大的音量对听力造成损害。接下来就让小编为大

网易邮箱,作为中国网民广泛使用的一种电子邮箱,一直以来以其稳定、高效的服务赢得了用户的信赖。而网易邮箱大师,则是专为手机用户打造的邮箱软件,它极大地简化了邮件的收发流程,让我们的邮件处理变得更加便捷。那么网易邮箱大师该如何使用,具体又有哪些功能呢,下文中本站小编将为大家带来详细的内容介绍,希望能帮助到大家!首先,您可以在手机应用商店搜索并下载网易邮箱大师应用。在应用宝或百度手机助手中搜索“网易邮箱大师”,然后按照提示进行安装即可。下载安装完成后,我们打开网易邮箱账号并进行登录,登录界面如下图所示

在如今云存储已经成为我们日常生活和工作中不可或缺的一部分。百度网盘作为国内领先的云存储服务之一,凭借其强大的存储功能、高效的传输速度以及便捷的操作体验,赢得了广大用户的青睐。而且无论你是想要备份重要文件、分享资料,还是在线观看视频、听取音乐,百度网盘都能满足你的需求。但是很多用户们可能对百度网盘app的具体使用方法还不了解,那么这篇教程就将为大家详细介绍百度网盘app如何使用,还有疑惑的用户们就快来跟着本文详细了解一下吧!百度云网盘怎么用:一、安装首先,下载并安装百度云软件时,请选择自定义安装选

MetaMask(中文也叫小狐狸钱包)是一款免费的、广受好评的加密钱包软件。目前,BTCC已支持绑定MetaMask钱包,绑定后可使用MetaMask钱包进行快速登入,储值、买币等,且首次绑定还可获得20USDT体验金。在BTCCMetaMask钱包教学中,我们将详细介绍如何注册和使用MetaMask,以及如何在BTCC绑定并使用小狐狸钱包。MetaMask钱包是什么?MetaMask小狐狸钱包拥有超过3,000万用户,是当今最受欢迎的加密货币钱包之一。它可免费使用,可作为扩充功能安装在网络

长按音箱的播放键后,在软件中连接wifi即可使用。教程适用型号:小米12系统:EMUI11.0版本:小爱同学2.4.21解析1首先找到音箱的播放键,长按进入配网模式。2在手机上的小爱音箱软件中登录小米账号,点击添加新的小爱音箱。3输入wifi的名称和密码后,即可呼唤小爱同学进行使用了。补充:小爱音箱有什么功能1小爱音箱有系统功能、社交功能、娱乐功能、知识功能、生活功能、智能家庭、训练计划。总结/注意事项手机要提前安装好小爱同学APP,方便连接和使用。
