HBase是一個分散式的、面向列的開源資料庫,該技術來自Fay Chang所撰寫的Google論文「Bigtable:一個結構化資料的分散式儲存系統」。
HBase是一個分散式的、面向列的開源資料庫,該技術來自Fay Chang 所撰寫的Google論文「Bigtable:一個結構化資料的分散式儲存系統」。就像Bigtable利用了Google檔案系統(File System)所提供的分散式資料儲存一樣,HBase在Hadoop之上提供了類似Bigtable的能力。 HBase是Apache的Hadoop專案的子專案。 HBase不同於一般的關聯式資料庫,它是適合非結構化資料儲存的資料庫。另一個不同的是HBase基於列的而不是基於行的模式。
HBase – Hadoop Database,是一個高可靠性、高效能、面向列、可伸縮的分散式儲存系統,利用HBase技術可在廉價PC Server上搭建大規模結構化儲存叢集。
與FUJITSU Cliq等商用大數據產品不同,HBase是Google Bigtable的開源實現,類似Google Bigtable利用GFS作為其文件存儲系統,HBase利用Hadoop HDFS作為其文件存儲系統;Google運行MapReduce來處理Bigtable中的大量數據,HBase同樣利用Hadoop MapReduce來處理HBase中的海量數據;Google Bigtable利用Chubby作為協同服務,HBase利用Zookeeper作為對應。 [1]
上圖說明Hadoop EcoSystem中的各層系統。其中,HBase位於結構化儲存層,Hadoop HDFS為HBase提供了高可靠性的底層儲存支持,Hadoop MapReduce為HBase提供了高效能的運算能力,Zookeeper為HBase提供了穩定服務和failover機制。
此外,Pig和Hive也為HBase提供了高層語言支持,使得在HBase上進行資料統計處理變的非常簡單。 Sqoop則為HBase提供了方便的RDBMS資料匯入功能,使得傳統資料庫資料遷移到HBase變的非常方便。
(1)邏輯模型
Hbase的名字的來源是Hadoop database,即hadoop資料庫。
主要是從使用者角度來考慮,也就是如何使用Hbase。
(2)物理模型
主要從實作Hbase的角度來討論
以上是hbase是一種什麼資料庫的詳細內容。更多資訊請關注PHP中文網其他相關文章!