java - hadoop数据查找
阿神
阿神 2017-04-18 10:48:19
0
1
632

使用hadoop查找文件中是否含有某些字符串,也就是要查找出set(string)中每个string对应的那一行,每条数据都不重复,请问怎么可以快速的找到呢?我写了简单的

# map.sh
awk -F "\03" '$3==xxx{print $0}' -

结果慢的要死,一直动不都不懂,请问有快点的办法吗?最好是可以一次性找出集合中所有的

阿神
阿神

闭关修行中......

全員に返信(1)
左手右手慢动作

手間を省きたい場合は、データを Hive にインポートして SQL を使用して解決しましょう

いいねを押す +0
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート