84669 人学习
152542 人学习
20005 人学习
5487 人学习
7821 人学习
359900 人学习
3350 人学习
180660 人学习
48569 人学习
18603 人学习
40936 人学习
1549 人学习
1183 人学习
32909 人学习
使用hadoop查找文件中是否含有某些字符串,也就是要查找出set(string)中每个string对应的那一行,每条数据都不重复,请问怎么可以快速的找到呢?我写了简单的
# map.sh awk -F "\03" '$3==xxx{print $0}' -
结果慢的要死,一直动不都不懂,请问有快点的办法吗?最好是可以一次性找出集合中所有的
闭关修行中......
这个写MR吧,如果你想省事就把数据导入到hive中,用sql 来解决
这个写MR吧,如果你想省事就把数据导入到hive中,用sql 来解决