masyarakat

Belajar

Perpustakaan Alatan

Alat AI

Masa lapang

Melayu

Rumah > masalah biasa > Hadoop是用于分布式计算的，它是什么东西

Hadoop是用于分布式计算的，它是什么东西

(*-*)浩

Lepaskan： 2019-11-18 14:01:23

asal

3411 orang telah melayarinya

Hadoop是用于分布式计算的，它是什么东西

hadoop是什么？

(1)Hadoop是一个开源的框架，可编写和运行分布式应用处理大规模数据，是专为离线和大规模数据分析而设计的，并不适合那种对几个记录随机读写的在线事务处理模式。 ( 推荐学习：web前端视频教程）

Hadoop=HDFS（文件系统，数据存储技术相关）+ Mapreduce（数据处理），Hadoop的数据来源可以是任何形式，在处理半结构化和非结构化数据上与关系型数据库相比有更好的性能，具有更灵活的处理能力，不管任何数据形式最终会转化为key/value，key/value是基本数据单元。

用函数式变成Mapreduce代替SQL，SQL是查询语句，而Mapreduce则是使用脚本和代码，而对于适用于关系型数据库，习惯SQL的Hadoop有开源工具hive代替。

(2)Hadoop就是一个分布式计算的解决方案.

hadoop能做什么？

hadoop擅长日志分析，facebook就用Hive来进行日志分析，2009年时facebook就有非编程人员的30%的人使用HiveQL进行数据分析；

淘宝搜索中的自定义筛选也使用的Hive；利用Pig还可以做高级的数据处理，包括Twitter、LinkedIn 上用于发现您可能认识的人，可以实现类似Amazon.com的协同过滤的推荐效果。

淘宝的商品推荐也是！在Yahoo！的40%的Hadoop作业是用pig运行的，包括垃圾邮件的识别和过滤，还有用户特征建模。

Hadoop 由许多元素构成。

其最底部是 Hadoop Distributed File System（HDFS），它存储 Hadoop 集群中所有存储节点上的文件。

HDFS的上一层是MapReduce 引擎，该引擎由 JobTrackers 和 TaskTrackers 组成。通过对Hadoop分布式计算平台最核心的分布式文件系统HDFS、MapReduce处理过程，以及数据仓库工具Hive和分布式数据库Hbase的介绍，基本涵盖了Hadoop分布式平台的所有技术核心。

Atas ialah kandungan terperinci Hadoop是用于分布式计算的，它是什么东西. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan：

hadoop

Artikel sebelumnya：计算机结束时断开终端的连接属于什么 Artikel seterusnya：ae播放键在哪

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel terbaru oleh pengarang

win10 1809稳定吗

2020-01-15 11:18:13
win10安装.Net Framework 3.5 sp1

2020-01-15 10:58:09
win10怎么连接外国网络

2020-01-15 10:34:39
win10更新1909要多久

2020-01-15 10:16:56
win10更新要多久

2020-09-14 10:58:08
win10游戏闪退修复办法

2020-01-15 09:58:52
win10蓝牙耳机麦克风不能用

2020-01-15 09:36:25
win10要装杀毒软件么

2020-01-15 09:28:34
win10许可证过期怎么激活

2020-01-15 09:22:01
win10重置卡在键盘布局解决办法

2020-01-15 09:09:20

Isu terkini

DeepSeek Web Version Masuk Rasmi

2025-03-12 13:42:01
Cara menyelesaikan masalah pelayan yang sibuk untuk DeepSeek

2025-03-12 13:39:01
Pintu Laman Web Rasmi DeepSeek yang mendalam

2025-03-12 13:33:01
Apakah alat AI?

2024-11-29 11:11:31
cadangan alat ai

2024-11-29 11:08:01

Topik-topik yang berkaitan

Lagi>

Cadangan popular

Tutorial Popular

Lagi>

Tutorial berkaitan

Cadangan popular

Kursus terkini

Muat turun terkini

Lagi>

kesan web

Kod sumber laman web

Bahan laman web

Templat hujung hadapan