一、進行遷移的原因

二、關係型資料庫與Nosql的一些區別

（1）儲存方式的區別

（2）CRUD一些差異

（3）索引的區別

（4）從mysql到nosql的發展的思考

（5）hbase為什麼可以儲存海量的資料呢

三、資料遷移遇到的一些問題

（1）聯合索引的問題

1、建立寬表

首頁

資料庫

mysql教程

資料從mysql遷移到hbase的一些思考及設計

黄舟

Mar 02, 2017 pm 04:45 PM

一、進行遷移的原因

由於業務的發展，使用mysql進行建立索引進行搜尋已經造成資料流的瓶頸卡在了資料庫io，例如每次dump全表的時候，會造成壓力過大，造成耗時很長，而且目前的資料量基本上已經達到了億級的資料量，如果希望mysql能更好的提供服務，下一步必須考慮分庫分錶才可以；基於這種情況下，考慮使用hbase用來進行資料的存儲，因為hbase所能承受的資料量遠大於mysql，而且對列的擴展也很方便

二、關係型資料庫與Nosql的一些區別

（1）儲存方式的區別

在類似mysql，sqlserver，oracle等關係型資料庫，資料的儲存是按照行進行儲存的，如下圖所示：

但是在hbase裡面，所有的資料都是基於列進行儲存的，如下所示：

其中hbase的邏輯模型如下圖所示：

其中：com.cnn.ww對應的是rowkey，相當於mysql的主鍵的概念

contents，anchor：這兩個對應的是列族的概念，在物理的儲存上，同一個列族的資料儲存在相同檔案

cnnsi.com，mylook.ca：對應的是列族下面的列，在hbase中列是可以動態增加的

對應的方格數據表示的是單元數據，即對應rowkey，cf：column下面的具體的值

其中tn：表示的是時間戳，單元資料的不同版本

其中有一張儲存結構如下：

（2）CRUD一些差異

CRUD是資料庫的最基本也是最常用的操作，在hbase裡面也有對應的指令，例如建表語句對於mysql的在此不詳述，對於hbase shell的如下所示

create 'table'，'columnfamily'

#即可以建立一個名為table，列族為columnfamily的表，其他的一些blocksize，version資料為默認

讀取資料的時候，在hbase語句如：get 'table'，'row','cf:column'即可得到對應的資料

更新資料的時候，在hbase中沒有對應更新的概念，只是會有一個新的版本，從時間戳上可以體現出來，所用的語句為

put 'table'，'row'，'cf：name'，'value '

即可將value的值賦給對應cf列族，name的列

刪除資料的區別，在mysql中刪除資料只能是直接刪除一行，或是將某一列置為空，在hbase裡面可以直接刪除某一列

（3）索引的區別

在mysql中可以建立索引，或是過濾查詢，但是在hbase中，只支援依照rowkey進行查詢速率最快

（4）從mysql到nosql的發展的思考

關係型資料庫的歷史已經很久，但是當資料量膨脹之後，例如對於mysql資料庫，當資料量為上億或更多的時候，如果按照索引進行查詢，可能效果也不是特別的明顯，最後只能按照主鍵進行查詢，或者逐漸發展為分庫分錶的模式，但是分庫分錶又給運維以及使用帶來了很大的麻煩；於是這個時候，nosql資料庫主鍵發展，nosql簡稱not only sql，是在資料量暴增的當前逐漸發展壯大起來，以nosql裡面的hbase作為例子，支持TB以及PB的數據，並且列的擴充特別的彈性

（5）hbase為什麼可以儲存海量的資料呢

其實hbase可以看做是mysql分庫分錶後的結果，只是不同的是mysql分庫分表後支援索引等，但是對於hbase僅支援rowkey作為主鍵索引，從書中可以知道，hbase的資料是按照列進行儲存的，並且當資料過大的時候，會按照行進行分裂，如下如所示：

把不同的region放到了不同的機器，並且最後還有master進行管理，即相當於對行列進行了一個劃分，從而儲存大量的資料

三、資料遷移遇到的一些問題

（1）聯合索引的問題

在mysql會有一些聯合索引的情況，例如存在一個商品與分類對應關係的表，需要得到某一個商品的所有分類，也希望可以得到某一個分類的所有商品，在mysql中直接按照聯合索引可以達到要求，但是在hbase的時候只能按照rowkey查詢如何辦呢

經過閱讀相關的資料得到有以下兩種的解決方法

1、建立寬表

在hbase中，允許行跟行之間的列是不同的，只要有共同的列族即可，那麼對於上述的情況，可以建立一個按照分類為rowkey的寬表，如下所示

分類id ，作為rowkey

product_id，作為列名字

value儲存為是否刪除

##上述即可rowkey為分類id ，可以直接從row得到所有的product_id，然後自己過濾是否刪除

2、建立高表

什麼是建立高表呢，也就是說不需要那麼多的列，只是儲存多行，因為在hbase裡面是按照字典順序排序的，因此可以進行如下的設計

分類id_商品id，作為rowkey

##只要scan以1開頭的行，就可以得到所有的資料

上述兩種辦法從本質上來說，都是建構了一個二級索引來儲存資料

# 以上就是資料從mysql遷移到hbase的一些思考及設計的內容，更多相關內容請關注PHP中文網（www.php. cn）！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

Video Face Swap

使用我們完全免費的人工智慧換臉工具，輕鬆在任何影片中換臉！

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

gmail信箱登陸入口在哪裡

7814

Java教學

1646

CakePHP 教程

1402

Laravel 教程

1300

PHP教程

1237

Related knowledge

MySQL：世界上最受歡迎的數據庫的簡介 Apr 12, 2025 am 12:18 AM

MySQL是一種開源的關係型數據庫管理系統，主要用於快速、可靠地存儲和檢索數據。其工作原理包括客戶端請求、查詢解析、執行查詢和返回結果。使用示例包括創建表、插入和查詢數據，以及高級功能如JOIN操作。常見錯誤涉及SQL語法、數據類型和權限問題，優化建議包括使用索引、優化查詢和分錶分區。

apache怎麼連接數據庫 Apr 13, 2025 pm 01:03 PM

Apache 連接數據庫需要以下步驟：安裝數據庫驅動程序。配置 web.xml 文件以創建連接池。創建 JDBC 數據源，指定連接設置。從 Java 代碼中使用 JDBC API 訪問數據庫，包括獲取連接、創建語句、綁定參數、執行查詢或更新以及處理結果。

MySQL的位置：數據庫和編程 Apr 13, 2025 am 12:18 AM

MySQL在數據庫和編程中的地位非常重要，它是一個開源的關係型數據庫管理系統，廣泛應用於各種應用場景。 1）MySQL提供高效的數據存儲、組織和檢索功能，支持Web、移動和企業級系統。 2）它使用客戶端-服務器架構，支持多種存儲引擎和索引優化。 3）基本用法包括創建表和插入數據，高級用法涉及多表JOIN和復雜查詢。 4）常見問題如SQL語法錯誤和性能問題可以通過EXPLAIN命令和慢查詢日誌調試。 5）性能優化方法包括合理使用索引、優化查詢和使用緩存，最佳實踐包括使用事務和PreparedStatemen

為什麼要使用mysql？利益和優勢 Apr 12, 2025 am 12:17 AM

選擇MySQL的原因是其性能、可靠性、易用性和社區支持。 1.MySQL提供高效的數據存儲和檢索功能，支持多種數據類型和高級查詢操作。 2.採用客戶端-服務器架構和多種存儲引擎，支持事務和查詢優化。 3.易於使用，支持多種操作系統和編程語言。 4.擁有強大的社區支持，提供豐富的資源和解決方案。

MySQL的角色：Web應用程序中的數據庫 Apr 17, 2025 am 12:23 AM

MySQL在Web應用中的主要作用是存儲和管理數據。 1.MySQL高效處理用戶信息、產品目錄和交易記錄等數據。 2.通過SQL查詢，開發者能從數據庫提取信息生成動態內容。 3.MySQL基於客戶端-服務器模型工作，確保查詢速度可接受。

docker怎麼啟動mysql Apr 15, 2025 pm 12:09 PM

在 Docker 中啟動 MySQL 的過程包含以下步驟：拉取 MySQL 鏡像創建並啟動容器，設置根用戶密碼並映射端口驗證連接創建數據庫和用戶授予對數據庫的所有權限

laravel入門實例 Apr 18, 2025 pm 12:45 PM

Laravel 是一款 PHP 框架，用於輕鬆構建 Web 應用程序。它提供一系列強大的功能，包括：安裝：使用 Composer 全局安裝 Laravel CLI，並在項目目錄中創建應用程序。路由：在 routes/web.php 中定義 URL 和處理函數之間的關係。視圖：在 resources/views 中創建視圖以呈現應用程序的界面。數據庫集成：提供與 MySQL 等數據庫的開箱即用集成，並使用遷移來創建和修改表。模型和控制器：模型表示數據庫實體，控制器處理 HTTP 請求。

解決數據庫連接問題：使用minii/db庫的實際案例 Apr 18, 2025 am 07:09 AM

在開發一個小型應用時，我遇到了一個棘手的問題：需要快速集成一個輕量級的數據庫操作庫。嘗試了多個庫後，我發現它們要么功能過多，要么兼容性不佳。最終，我找到了minii/db，這是一個基於Yii2的簡化版本，完美地解決了我的問題。

See all articles

資料從mysql遷移到hbase的一些思考及設計

一、進行遷移的原因

二、關係型資料庫與Nosql的一些區別

（1）儲存方式的區別

（2）CRUD一些差異

（3）索引的區別

（4）從mysql到nosql的發展的思考

（5）hbase為什麼可以儲存海量的資料呢

三、資料遷移遇到的一些問題

（1）聯合索引的問題

1、建立寬表

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題