首頁 資料庫 mysql教程 LevelDB系列之SSTable(Sorted Strings Table)文件

LevelDB系列之SSTable(Sorted Strings Table)文件

Jun 07, 2016 pm 05:37 PM
leveldb sorted 系列

SSTable是Bigtable中至关重要的一块,对于LevelDb来说也是如此,对LevelDb的SSTable实现细节的了解也有助于了解Bigtable中一些实现细节。 本节内容主要讲述SSTable的静态布局结构,我们曾在整体架构中说过,SSTable文件形成了不同Level的层级结构,至于这个

 

SSTable是Bigtable中至关重要的一块,对于LevelDb来说也是如此,对LevelDb的SSTable实现细节的了解也有助于了解Bigtable中一些实现细节。

本节内容主要讲述SSTable的静态布局结构,我们曾在“整体架构”中说过,SSTable文件形成了不同Level的层级结构,至于这个层级结构是如何形成的我们放在后面Compaction一节细说。本节主要介绍SSTable某个文件的物理布局和逻辑布局结构,这对了解LevelDb的运行过程很有帮助。

LevelDb不同层级有很多SSTable文件(以后缀.sst为特征),所有.sst文件内部布局都是一样的。上节介绍Log文件是物理分块的,SSTable也一样会将文件划分为固定大小的物理存储块,但是两者逻辑布局大不相同,,根本原因是:Log文件中的记录是Key无序的,即先后记录的key大小没有明确大小关系,而.sst文件内部则是根据记录的Key由小到大排列的,从下面介绍的SSTable布局可以体会到Key有序是为何如此设计.sst文件结构的关键。

wps_clip_image-18291

图4.1 .sst文件的分块结构

图4.1展示了一个.sst文件的物理划分结构,同Log文件一样,也是划分为固定大小的存储块,每个Block分为三个部分,红色部分是数据存储区,蓝色的Type区用于标识数据存储区是否采用了数据压缩算法(Snappy压缩或者无压缩两种),CRC部分则是数据校验码,用于判别数据是否在生成和传输中出错。

以上是.sst的物理布局,下面介绍.sst文件的逻辑布局,所谓逻辑布局,就是说尽管大家都是物理块,但是每一块存储什么内容,内部又有什么结构等。图4.2展示了.sst文件的内部逻辑解释。

wps_clip_image-4580

图4.2逻辑布局

从图4.2可以看出,从大的方面,可以将.sst文件划分为数据存储区和数据管理区,数据存储区存放实际的Key:Value数据,数据管理区则提供一些索引指针等管理数据,目的是更快速便捷的查找相应的记录。两个区域都是在上述的分块基础上的,就是说文件的前面若干块实际存储KV数据,后面数据管理区存储管理数据。管理数据又分为四种不同类型:紫色的Meta Block,红色的MetaBlock 索引和蓝色的数据索引块以及一个文件尾部块。

LevelDb 1.2版对于Meta Block尚无实际使用,只是保留了一个接口,估计会在后续版本中加入内容,下面我们看看数据索引区和文件尾部Footer的内部结构。

wps_clip_image-18980

图4.3数据索引

图4.3是数据索引的内部结构示意图。再次强调一下,Data Block内的KV记录是按照Key由小到大排列的,数据索引区的每条记录是对某个Data Block建立的索引信息,每条索引信息包含三个内容,以图4.3所示的数据块i的索引Index i来说:红色部分的第一个字段记载大于等于数据块i中最大的Key值的那个Key,第二个字段指出数据块i在.sst文件中的起始位置,第三个字段指出Data Block i的大小(有时候是有数据压缩的)。后面两个字段好理解,是用于定位数据块在文件中的位置的,第一个字段需要详细解释一下,在索引里保存的这个Key值未必一定是某条记录的Key,以图4.3的例子来说,假设数据块i 的最小Key=“samecity”,最大Key=“the best”;数据块i+1的最小Key=“the fox”,最大Key=“zoo”,那么对于数据块i的索引Index i来说,其第一个字段记载大于等于数据块i的最大Key(“the best”)同时要小于数据块i+1的最小Key(“the fox”),所以例子中Index i的第一个字段是:“the c”,这个是满足要求的;而Index i+1的第一个字段则是“zoo”,即数据块i+1的最大Key。

文件末尾Footer块的内部结构见图4.4,metaindex_handle指出了metaindex block的起始位置和大小;inex_handle指出了index Block的起始地址和大小;这两个字段可以理解为索引的索引,是为了正确读出索引值而设立的,后面跟着一个填充区和魔数。

wps_clip_image-24284

图4.4Footer

上面主要介绍的是数据管理区的内部结构,下面我们看看数据区的一个Block的数据部分内部是如何布局的(图4.1中的红色部分),图4.5是其内部布局示意图。

wps_clip_image-7105

图4.5数据Block内部结构

从图中可以看出,其内部也分为两个部分,前面是一个个KV记录,其顺序是根据Key值由小到大排列的,在Block尾部则是一些“重启点”(Restart Point),其实是一些指针,指出Block内容中的一些记录位置。

“重启点”是干什么的呢?我们一再强调,Block内容里的KV记录是按照Key大小有序的,这样的话,相邻的两条记录很可能Key部分存在重叠,比如key i=“the Car”,Key i+1=“the color”,那么两者存在重叠部分“the c”,为了减少Key的存储量,Key i+1可以只存储和上一条Key不同的部分“olor”,两者的共同部分从Key i中可以获得。记录的Key在Block内容部分就是这么存储的,主要目的是减少存储开销。“重启点”的意思是:在这条记录开始,不再采取只记载不同的Key部分,而是重新记录所有的Key值,假设Key i+1是一个重启点,那么Key里面会完整存储“the color”,而不是采用简略的“olor”方式。Block尾部就是指出哪些记录是这些重启点的。

wps_clip_image-6552

图4.6记录格式

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

小米 15 系列全代號曝光:Dada、Haotian、Xuanyuan 小米 15 系列全代號曝光:Dada、Haotian、Xuanyuan Aug 22, 2024 pm 06:47 PM

小米15系列預計10月正式發布,其全系列代號已在外媒MiCode程式碼庫曝光。其中,旗艦級小米15Ultra代號為"Xuanyuan"(意為"軒轅"),此名源自中國神話中的黃帝,象徵尊貴。小米15的代號為"Dada",而小米15Pro則以"Haotian"(意為"昊天")為名。小米15SPro內部代號為"dijun",暗指《山海經》創世神帝俊。小米15Ultra系列涵蓋

華為 Mate 60 系列最佳入手時機,新增 AI 消除 + 影像升級,更可享秋日禮遇活動 華為 Mate 60 系列最佳入手時機,新增 AI 消除 + 影像升級,更可享秋日禮遇活動 Aug 29, 2024 pm 03:33 PM

自去年华为Mate60系列开售以来,我个人就一直将Mate60Pro作为主力机使用。在将近一年的时间里,华为Mate60Pro经过多次OTA升级,综合体验有了显著提升,给人一种常用常新的感觉。比如近期,华为Mate60系列就再度迎来了影像功能的重磅升级。首先是新增AI消除功能,可以智能消除路人、杂物并对空白部分进行自动补充;其次是主摄色准、长焦清晰度均有明显升级。考虑到现在是开学季,华为Mate60系列还推出了秋日礼遇活动:购机可享至高800元优惠,入手价低至4999元。常用常新的产品力加上超值

iPhone 15 和iPhone 15 Pro 怎麼挑?九大差異一次過目 iPhone 15 和iPhone 15 Pro 怎麼挑?九大差異一次過目 Sep 14, 2023 am 08:01 AM

iPhone15與iPhone15Pro在今日正式發表,不過Pro系列作為高階機型,除了價格更高以外,也有許多專屬功能,消費者在購買前得先認清差異,才不會在買了iPhone15後,才發現有些功能只有Pro系列才能用。顯示器儘管搭載了相同的顯示面板,但ProMotion自動適應更新頻率技術與永遠顯示功能仍然是Pro系列專屬。其餘無論在解析度、對比、峰值亮度等層面,iPhone15與iPhone15Pro系列皆相同。動作按鈕動作按鈕目前是iPhone15Pro系列的專屬設計,可以讓使用者個人化自

java Sorted怎麼使用 java Sorted怎麼使用 Apr 19, 2023 am 11:40 AM

概念1、Sorted是中間操作,傳回排列順序的Stream。如果不輸入自訂的Comparator,這些要素將按自然順序排列。使用注意2、在執行Sorted操作之後,stringCollection中元素的順序沒有改變。 Sorted只對流中的元素進行排序,而不會改變原始集合中元素的順序。實例stringCollection.stream().sorted().filter((s)->s.startsWith("a")).forEach(System.out::printl

CentOS下方安裝LevelDB及CentOS安裝v2 CentOS下方安裝LevelDB及CentOS安裝v2 Feb 14, 2024 am 09:33 AM

在CentOS系統中安裝和設定LevelDB是一項非常有用的技能,LevelDB是一個高效能的鍵值儲存庫,可用於建立各種應用程序,如資料庫、快取和日誌系統等,本文將詳細介紹在CentOS系統上安裝和設定LevelDB的過程,並提供一些實用的指令​​和技巧。 CentOS下安裝LevelDB以下是在CentOS系統上安裝LevelDB的步驟:安裝依賴項在開始安裝LevelDB之前,需要先安裝一些必要的依賴項,打開終端機並執行以下命令來安裝這些依賴項:```sudoyuminstallsnappy- deve

列表排序:Python的sort、sorted和numpy.argsort方法詳解 列表排序:Python的sort、sorted和numpy.argsort方法詳解 Jun 10, 2023 am 09:22 AM

在Python程式設計中,經常需要對清單或陣列進行排序操作。 Python提供了多種排序方法,包括sort、sorted和numpy.argsort等。本文將詳細介紹這些排序方法的使用方法和注意事項。一、sort方法sort方法是Python列表中內建的方法,可以對列表進行原地排序(即有傳回值但不產生新的排序物件),不需要額外的導入庫。 sort方法的參數有兩個:k

Python函數介紹:sorted函數的用法和範例 Python函數介紹:sorted函數的用法和範例 Nov 03, 2023 am 11:02 AM

Python函數介紹:sorted函數的用法和範例Python擁有許多內建函數,其中一個非常常用的函數是sorted()函數。 sorted()函數用於對可迭代物件進行排序,並傳回一個新的已排序的清單。本文將介紹sorted()函數的用法,並提供一些具體的程式碼範例。 sorted()函數的基本用法sorted()函數的基本語法如下:sorted(iterable

iPhone 15 Pro及15 Pro Max新改進預覽 iPhone 15 Pro及15 Pro Max新改進預覽 Sep 12, 2023 pm 10:45 PM

Apple於9月13日凌晨1時發表會將會有4款新iPhone登場,分別為iPhone15、15Plus、15Pro及15ProMax。高階的iPhone15Pro和ProMax將使用全新設計,側邊材質從不鏽鋼變更為鈦金屬。 Pro系列的顏色有灰、黑、深藍、白等選項。 iPhone15Pro和ProMax的螢幕今年會比去年的14Pro及14ProMax稍微大一些。這項變更是由於蘋果採用了名為LIPO(低注射壓力包覆成型)的新製程技術,使得螢幕邊框厚度減少了約三分之一。高階型號將換用具有磨砂質感的鈦金屬

See all articles