首頁

資料庫

mysql教程

解剖SQLSERVER 第十三篇 Integers在行压缩和页压缩里的存储格

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 07, 2016 pm 03:19 PM

sqlserver

解剖 SQLSERVER 第十三篇 Integers在行压缩和页压缩里的存储格式揭秘（译） http://improve.dk/the-anatomy-of-row-amp-page-compressed-integers/ 当解决OrcaMDF对行压缩的支持的时候，视图解析整数的时候遇到了一些挑战。和正常的未压缩整数

解剖SQLSERVER 第十三篇 Integers在行压缩和页压缩里的存储格式揭秘（译）

http://improve.dk/the-anatomy-of-row-amp-page-compressed-integers/

当解决OrcaMDF对行压缩的支持的时候，视图解析整数的时候遇到了一些挑战。

和正常的未压缩整数存储不同的是这些都是可变长度--这意味着1个整数的值50只占用1个字节，而不是通常的4个字节。

这些不是新功能了，大家可以看一下vardecimal他被存储为可变长度。然而不同的是两者存储在磁盘上的数据的方式。

注意虽然我只是实现行压缩，他跟页面压缩中使用的行压缩是一样的，并没有区别

大家可以看一下《深入解析SQL Server 2008 笔记》里面有行压缩和页压缩的详细解释

Tinyint
Tinyint在压缩后和压缩前基本是一样的（tinyint：从0到255的整数数据，存储大小为 1 字节）只有一个例外情况，当数值是0的时候如果开启了行压缩将不占用任何字节，

如果是非压缩存储将会存储0x0，并且占用一个字节。所有的整形类型（tinyint，smallint，int，bigint）对于0这个数值都是同等对待，数值由压缩行元数据进行描述并且不存储任何值

Smallint
让我们开始通过观察正常的未压缩的smallint数值，对于 -2，-1，1，2这些值的存储，0不会存储任何东西。注意，所有这些值会准确的存放在磁盘上，在这种情况下他们使用小字节序来存储

<span>-</span><span>2</span>    <span>=</span>    <span>0xFEFF</span>
<span>-</span><span>1</span>    <span>=</span>    <span>0xFFFF</span>
<span>1</span>    <span>=</span>    <span>0x0100</span>
<span>2</span>    <span>=</span>    <span>0x0200</span>

登入後複製

Little-Endian

从1，2 这两个值开始，他们很直接很简单的转换为decimal和你想要的实际数值。然而，-1有点不一样，显示0xFEFF 将他转换为decimal是65.535 --我们能存储的最大的无符号整形值是2个字节，

SQLSERVER对于一个smallint 的范围是–32768 to 32767

计算实际值依赖于所使用的整数溢出。看看下面的C#代码片段:

<span>unchecked</span><span>
{
    Console.WriteLine(</span><span>0</span> + (<span>short</span>)<span>32767</span><span>);
    Console.WriteLine(</span><span>0</span> + (<span>short</span>)<span>32768</span><span>);
    Console.WriteLine(</span><span>0</span> + (<span>short</span>)<span>32769</span><span>);
    </span><span>//</span><span> ...</span>
    Console.WriteLine(<span>0</span> + (<span>short</span>)<span>65534</span><span>);
    Console.WriteLine(</span><span>0</span> + (<span>short</span>)<span>65535</span><span>);
}</span>

登入後複製

输出如下：

<span>32767</span>
-<span>32768</span>
-<span>32767</span>
-<span>2</span>
-<span>1</span>

登入後複製

如果我们这样计算 0+有符号short的最大值，那么最大值就是有符号短整型 32767，很明显负数就是-32767，

然而，如果我们这样计算 0+32.768=32768，那么就会超出short的范围，我们将最高位翻转变成负数 -32768 却不会溢出。

因为这些数都是常数，编译器不允许溢出--除非我们将代码封装在uncheck ｛｝div里面

你可能曾经听过虚构的符号位。基本上它的最高位被用于指示一个数是正数还是负数。

从上面的例子应该很明显的显示符号位不是那么特别--通过查询这个符号位决定一个给定的数的符号。看一下当溢出的时候符号位会怎样

<span>32767</span>    =<span>    0b0111111111111111
</span>-<span>32768</span>    =<span>    0b1000000000000000
</span>-<span>32767</span>    =    0b1000000000000001

登入後複製

对于由于太大而引起溢出的数字，最高位“sign bit”需要进行设置。这不神奇,它只是用来引起溢出。

那么，我们有一些背景知识知道一个常规的非压缩integers 是如何存储的。现在看一下那些同样数值的smallint 是如何存储在行压缩表里的

-<span>2</span>    =    <span>0x7E</span>
-<span>1</span>    =    <span>0x7F</span>
<span>1</span>    =    <span>0x81</span>
<span>2</span>    =    <span>0x82</span>

登入後複製

让我们尝试将这些值转换为decimal，我做如下转换

-<span>2</span>    =    <span>0x7E</span>    =    -<span>128</span> + <span>126</span>
-<span>1</span>    =    <span>0x7F</span>    =    -<span>128</span> + <span>127</span>
<span>1</span>    =    <span>0x81</span>    =    -<span>128</span> + <span>129</span>
<span>2</span>    =    <span>0x82</span>    =    -<span>128</span> + <span>130</span>

登入後複製

很明显，这些值会以另一种方式进行存储。最明显的不同是我们现在只使用一个字节--由于变成了可变长度存储。当我们解析这些值的时候，我们需要简单的看一下这些数字的字节存储。如果只使用一个字节，我们知道这表示0到255（对于tinyint来讲）或者对于smallint 数值是 -128到127 。当smallint 存储的那个值范围在-128到127 就会使用一个字节来存储

如果我们使用相同的方法，我们明显会获得错误的结果。1 0 + 129 诀窍是在本例中将存储的值作为无符号整数，然后最小值作为偏移量
而不是使用0来作为偏移，我们将使用有符号的一个字节最小值-128 作为偏移

-<span>2</span>    =    <span>0x7E</span>    =    -<span>128</span> + <span>126</span>
-<span>1</span>    =    <span>0x7F</span>    =    -<span>128</span> + <span>127</span>
<span>1</span>    =    <span>0x81</span>    =    -<span>128</span> + <span>129</span>
<span>2</span>    =    <span>0x82</span>    =    -<span>128</span> + <span>130</span>

登入後複製

这意味着一旦我们超出有符号的1个字节的范围我们将需要用2个字节来存储，对吗？

解剖SQLSERVER 第十三篇 Integers在行压缩和页压缩里的存储格

一个非常重要的区别是,非压缩值会永远使用小字节序来存储，然而使用了行压缩的整数值却使用大字节序来存储！
所以，他们不只使用不同的偏移值，而使用不同的字节序。但是最终的结果都是相同的，不过计算方式却有很大的不同

Int 和 bigint
一旦我找到字节序的规律和行压缩整型值的数值架构，int和bigint的实现就很简单了。和其他类型一样，他们也是可变长度的所以你有可能会碰到5字节长的bigint值和1字节长的int值。下面是SqlBigInt 类型的主要解析代码

<span>switch</span><span> (value.Length)
{
    </span><span>case</span> <span>0</span><span>:
        </span><span>return</span> <span>0</span><span>;

    </span><span>case</span> <span>1</span><span>:
        </span><span>return</span> (<span>long</span>)(-<span>128</span> + value[<span>0</span><span>]);

    </span><span>case</span> <span>2</span><span>:
        </span><span>return</span> (<span>long</span>)(-<span>32768</span> + BitConverter.ToUInt16(<span>new</span>[] { value[<span>1</span>], value[<span>0</span>] }, <span>0</span><span>));

    </span><span>case</span> <span>3</span><span>:
        </span><span>return</span> (<span>long</span>)(-<span>8388608</span> + BitConverter.ToUInt32(<span>new</span> <span>byte</span>[] { value[<span>2</span>], value[<span>1</span>], value[<span>0</span>], <span>0</span> }, <span>0</span><span>));

    </span><span>case</span> <span>4</span><span>:
        </span><span>return</span> (<span>long</span>)(-<span>2147483648</span> + BitConverter.ToUInt32(<span>new</span>[] { value[<span>3</span>], value[<span>2</span>], value[<span>1</span>], value[<span>0</span>] }, <span>0</span><span>));

    </span><span>case</span> <span>5</span><span>:
        </span><span>return</span> (<span>long</span>)(-<span>549755813888</span> + BitConverter.ToInt64(<span>new</span> <span>byte</span>[] { value[<span>4</span>], value[<span>3</span>], value[<span>2</span>], value[<span>1</span>], value[<span>0</span>], <span>0</span>, <span>0</span>, <span>0</span> }, <span>0</span><span>));

    </span><span>case</span> <span>6</span><span>:
        </span><span>return</span> (<span>long</span>)(-<span>140737488355328</span> + BitConverter.ToInt64(<span>new</span> <span>byte</span>[] { value[<span>5</span>], value[<span>4</span>], value[<span>3</span>], value[<span>2</span>], value[<span>1</span>], value[<span>0</span>], <span>0</span>, <span>0</span> }, <span>0</span><span>));

    </span><span>case</span> <span>7</span><span>:
        </span><span>return</span> (<span>long</span>)(-<span>36028797018963968</span> + BitConverter.ToInt64(<span>new</span> <span>byte</span>[] { value[<span>6</span>], value[<span>5</span>], value[<span>4</span>], value[<span>3</span>], value[<span>2</span>], value[<span>1</span>], value[<span>0</span>], <span>0</span> }, <span>0</span><span>));

    </span><span>case</span> <span>8</span><span>:
        </span><span>return</span> (<span>long</span>)(-<span>9223372036854775808</span> + BitConverter.ToInt64(<span>new</span>[] { value[<span>7</span>], value[<span>6</span>], value[<span>5</span>], value[<span>4</span>], value[<span>3</span>], value[<span>2</span>], value[<span>1</span>], value[<span>0</span>] }, <span>0</span><span>));

    </span><span>default</span><span>:
        </span><span>throw</span> <span>new</span> ArgumentException(<span>"</span><span>Invalid value length: </span><span>"</span> +<span> value.Length);
}</span>

登入後複製

可变长度的值是一个包含字节数据的字节数组存储在磁盘上。如果长度是0，没有东西存储因此我们知道他的值为0。

对于每一个剩余的有效长度，简单的使用最小的显示值作为偏移并且添加上存储的值

对于非压缩值我们可以使用BitConverter 类直接将输入值使用系统字节序转为期望值，对于大多数的英特尔和AMD系统，一般都是小字节序（意味着OrcaMDF 不会运行在一个大字节序的系统上）。然而，当压缩值使用大字节序进行压缩，我必须重新映射输入的数组为小端字节格式，并且在字节尾补上0 以便匹配short，int和long的大小

对于shorts和ints 我将无符号数值读取进来，因为这是我所感兴趣的。工作原理是将int 和uint强制转换为long值。我不能对long类型做同样的事情因为没有其他数据类型比long 更大了。对于long的最大值为9.223.372.036.854.775.807，在磁盘里实际存储为0xFFFFFFFFFFFFFFFF。解析有符号long型使用BitConverter得出的结果 -1 由于会导致溢出。由于额外的负数溢出这有可能会导致出错

-<span>9.223</span>.<span>372.036</span>.<span>854.775</span>.<span>808</span> + <span>0xFFFFFFFFFFFFFF</span> =>
-<span>9.223</span>.<span>372.036</span>.<span>854.775</span>.<span>808</span> + -<span>1</span> =
<span>9.223</span>.<span>372.036</span>.<span>854.775</span>.<span>807</span>

登入後複製

结论
通常我有很多的有趣的尝试通过执行一个select语句去找出数值在磁盘上以哪一个字节结束。
这不会花很长的时间去实现，技术内幕的书只是作为引导，还有很多东西需要我们深入挖掘

第十三篇完

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

AI Hentai Generator

免費產生 AI 無盡。

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

gmail信箱登陸入口在哪裡

7500

CakePHP 教程

1377

steam的賬戶名稱是什麼格式

win11激活密鑰永久

NYT連接提示和答案

Related knowledge

sqlserver怎麼匯入mdf文件 Apr 08, 2024 am 11:41 AM

匯入步驟如下：將 MDF 檔案複製到 SQL Server 的資料目錄（通常為 C:\Program Files\Microsoft SQL Server\MSSQL\DATA）。在 SQL Server Management Studio（SSMS）中，開啟資料庫並選擇「附加」。點選“新增”按鈕，選擇 MDF 檔案。確認資料庫名稱，點選確定按鈕即可。

sqlserver資料庫中已存在名為的物件怎麼解決 Apr 05, 2024 pm 09:42 PM

對於 SQL Server 資料庫中已存在同名對象，需要採取下列步驟：確認物件類型（表格、檢視、預存程序）。如果物件為空，可使用 IF NOT EXISTS 跳過建立。如果物件有數據，使用不同名稱或修改結構。使用 DROP 刪除現有物件（謹慎操作，建議備份）。檢查架構更改，確保沒有引用刪除或重新命名的物件。

sqlserver服務無法啟動怎麼辦 Apr 05, 2024 pm 10:00 PM

當 SQL Server 服務無法啟動時，可採取下列步驟解決：檢查錯誤日誌以確定根本原因。確保服務帳戶具有啟動服務的權限。檢查依賴項服務是否正在執行。禁用防毒軟體。修復 SQL Server 安裝。如果修復不起作用，重新安裝 SQL Server。

怎麼查看sqlserver連接埠號 Apr 05, 2024 pm 09:57 PM

若要查看 SQL Server 連接埠號碼：開啟 SSMS，連線到伺服器。在物件資源管理器中找到伺服器名稱，右鍵單擊它，然後選擇“屬性”。在「連線」標籤中，查看「TCP 連接埠」欄位。

sqlserver資料庫在哪裡 Apr 05, 2024 pm 08:21 PM

SQL Server 資料庫檔案通常儲存在下列預設位置：Windows: C:\Program Files\Microsoft SQL Server\MSSQL\DATALinux: /var/opt/mssql/data可透過修改資料庫檔案路徑設定來自訂資料庫檔案位置。

sqlserver誤刪資料庫怎麼恢復 Apr 05, 2024 pm 10:39 PM

若誤刪 SQL Server 資料庫，可採取下列步驟還原：停止資料庫活動；備份日誌檔案；檢查資料庫日誌；復原選項：從備份還原；從交易日誌還原；使用 DBCC CHECKDB；使用第三方工具。請定期備份資料庫並啟用交易日誌以防止資料遺失。

Java連接SqlServer錯誤如何解決 May 01, 2023 am 09:22 AM

問題發現這次使用的是SqlServer資料庫，之前並沒有使用過，但是問題不大，我按照需求文檔的步驟連接好SqlServer之後，啟動SpringBoot項目，發現了一個報錯，如下：剛開始我以為是SqlServer連接問題呢，於是便去查看資料庫，發現資料庫一切正常，我首先第一時間問了我的同事，他們是否有這樣的問題，發現他們並沒有，於是我便開始了我最拿手的環節，面向百度程式設計.開始解決具體報錯資訊是這樣，於是我便開始了百度報錯：ERRORc.a.d.p.DruidDataSource$CreateCo

sqlserver安裝失敗怎麼樣刪除乾淨 Apr 05, 2024 pm 11:27 PM

如果 SQL Server 安裝失敗，可透過下列步驟清理：解除安裝 SQL Server刪除註冊表項刪除檔案和資料夾重新啟動計算機

See all articles

解剖SQLSERVER 第十三篇 Integers在行压缩和页压缩里的存储格

解剖SQLSERVER 第十三篇 Integers在行压缩和页压缩里的存储格式揭秘（译）

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題