数据样式如下,如何用mapReduce进行统计 性别是男性的小孩有多少? (小朋友的性命未知,数据结构感人!_!)
一个db的集合里大约有百万级的这样的数据
{
"name":"向日癸班的小贫油",
"小新":{
"姓名":"小新",
"年龄":"6",
"性别":"男"
},
"妮妮":{
"姓名":"妮妮",
"年龄":"7",
"性别":"女"
},
"风间":{
"姓名":"风间",
"年龄":"7",
"性别":"男"
},
"阿呆":{
"姓名":"阿呆",
"年龄":"6",
"性别":"男"
},
.
.
.
.
.
}
对于这个数据结构使用MapReduce做统计,不知道楼主找到解决方法了没有?首先不能确定一条记录有多少像
这样的数据,而且map的key你也不是固定的,所以比较难定位到性别这个字段。我能想到的实现就是在程序中做统计,也就是从数据库中取出来。如果楼主实现了MapReduce的统计,希望共享一下实现,谢谢