데이터 베이스 MySQL 튜토리얼 解剖SQLSERVER 第十三篇 Integers在行压缩和页压缩里的存储格

解剖SQLSERVER 第十三篇 Integers在行压缩和页压缩里的存储格

Jun 07, 2016 pm 03:19 PM
sqlserver

解剖 SQLSERVER 第十三篇 Integers在行 压缩 和页 压缩 里的 存储 格式 揭秘 (译) http://improve.dk/the-anatomy-of-row-amp-page-compressed-integers/ 当解决OrcaMDF对行 压缩 的支持的时候,视图解析整数的时候遇到了一些挑战。 和正常的未 压缩 整数

解剖SQLSERVER 第十三篇    Integers在行压缩和页压缩里的存储格式揭秘(译)

http://improve.dk/the-anatomy-of-row-amp-page-compressed-integers/

当解决OrcaMDF对行压缩的支持的时候,视图解析整数的时候遇到了一些挑战。

和正常的未压缩整数存储不同的是这些都是可变长度--这意味着1个整数的值50只占用1个字节,而不是通常的4个字节。

这些不是新功能了,大家可以看一下vardecimal他被存储为可变长度。然而不同的是两者存储在磁盘上的数据的方式。

注意虽然我只是实现行压缩,他跟页面压缩中使用的行压缩是一样的,并没有区别

大家可以看一下《深入解析SQL Server 2008 笔记》里面有行压缩和页压缩的详细解释

 

 

Tinyint
Tinyint在压缩后和压缩前基本是一样的(tinyint:从0到255的整数数据,存储大小为 1 字节)只有一个例外情况,当数值是0的时候如果开启了行压缩将不占用任何字节,

如果是非压缩存储将会存储0x0,并且占用一个字节。所有的整形类型(tinyint,smallint,int,bigint)对于0这个数值都是同等对待,数值由压缩行元数据进行描述并且不存储任何值

 

Smallint
让我们开始通过观察正常的未压缩的smallint数值, 对于 -2,-1,1,2这些值的存储,0不会存储任何东西。注意,所有这些值会准确的存放在磁盘上,在这种情况下他们使用小字节序来存储

<span>-</span><span>2</span>    <span>=</span>    <span>0xFEFF</span>
<span>-</span><span>1</span>    <span>=</span>    <span>0xFFFF</span>
<span>1</span>    <span>=</span>    <span>0x0100</span>
<span>2</span>    <span>=</span>    <span>0x0200</span>
로그인 후 복사

Little-Endian

从1,2 这两个值开始,他们很直接很简单的转换为decimal和你想要的实际数值。然而,-1有点不一样,显示0xFEFF 将他转换为decimal是65.535 --我们能存储的最大的无符号整形值是2个字节,

SQLSERVER对于一个smallint 的范围是–32768 to 32767

 

计算实际值依赖于所使用的整数溢出。看看下面的C#代码片段:

<span>unchecked</span><span>
{
    Console.WriteLine(</span><span>0</span> + (<span>short</span>)<span>32767</span><span>);
    Console.WriteLine(</span><span>0</span> + (<span>short</span>)<span>32768</span><span>);
    Console.WriteLine(</span><span>0</span> + (<span>short</span>)<span>32769</span><span>);
    </span><span>//</span><span> ...</span>
    Console.WriteLine(<span>0</span> + (<span>short</span>)<span>65534</span><span>);
    Console.WriteLine(</span><span>0</span> + (<span>short</span>)<span>65535</span><span>);
}</span>
로그인 후 복사

输出如下:

<span>32767</span>
-<span>32768</span>
-<span>32767</span>
-<span>2</span>
-<span>1</span>
로그인 후 복사


如果我们这样计算 0+有符号short的最大值,那么最大值就是有符号短整型 32767,很明显负数就是-32767,

然而,如果我们这样计算 0+32.768=32768,那么就会超出short的范围,我们将最高位翻转变成负数 -32768 却不会溢出。

因为这些数都是常数,编译器不允许溢出--除非我们将代码封装在uncheck {}div里面

 

你可能曾经听过虚构的符号位。基本上它的最高位被用于指示一个数是正数还是负数。

从上面的例子应该很明显的显示符号位不是那么特别--通过查询这个符号位决定一个给定的数的符号。看一下当溢出的时候符号位会怎样

<span>32767</span>    =<span>    0b0111111111111111
</span>-<span>32768</span>    =<span>    0b1000000000000000
</span>-<span>32767</span>    =    0b1000000000000001
로그인 후 복사

 

对于由于太大而引起溢出的数字,最高位“sign bit”需要进行设置。这不神奇,它只是用来引起溢出。

那么,我们有一些背景知识知道一个常规的非压缩integers 是如何存储的。现在看一下那些同样数值的smallint 是如何存储在行压缩表里的

-<span>2</span>    =    <span>0x7E</span>
-<span>1</span>    =    <span>0x7F</span>
<span>1</span>    =    <span>0x81</span>
<span>2</span>    =    <span>0x82</span>
로그인 후 복사

让我们尝试将这些值转换为decimal,我做如下转换

-<span>2</span>    =    <span>0x7E</span>    =    -<span>128</span> + <span>126</span>
-<span>1</span>    =    <span>0x7F</span>    =    -<span>128</span> + <span>127</span>
<span>1</span>    =    <span>0x81</span>    =    -<span>128</span> + <span>129</span>
<span>2</span>    =    <span>0x82</span>    =    -<span>128</span> + <span>130</span>
로그인 후 복사
로그인 후 복사

很明显,这些值会以另一种方式进行存储。最明显的不同是我们现在只使用一个字节--由于变成了可变长度存储。当我们解析这些值的时候,我们需要简单的看一下这些数字的字节存储。如果只使用一个字节,我们知道这表示0到255(对于tinyint来讲) 或者对于smallint 数值是 -128到127 。当smallint 存储的那个值范围在-128到127 就会使用一个字节来存储

 

如果我们使用相同的方法,我们明显会获得错误的结果 。1 0 + 129 诀窍是在本例中将存储的值作为无符号整数,然后最小值作为偏移量
而不是使用0来作为偏移,我们将使用有符号 的一个字节最小值-128 作为偏移

-<span>2</span>    =    <span>0x7E</span>    =    -<span>128</span> + <span>126</span>
-<span>1</span>    =    <span>0x7F</span>    =    -<span>128</span> + <span>127</span>
<span>1</span>    =    <span>0x81</span>    =    -<span>128</span> + <span>129</span>
<span>2</span>    =    <span>0x82</span>    =    -<span>128</span> + <span>130</span>
로그인 후 복사
로그인 후 복사

 

这意味着一旦我们超出有符号 的1个字节的范围 我们将需要用2个字节来存储,对吗?

解剖SQLSERVER 第十三篇    Integers在行压缩和页压缩里的存储格

 

一个非常重要的区别是,非压缩值会永远使用小字节序来存储,然而使用了行压缩的整数值却使用大字节序来存储
所以,他们不只使用不同的偏移值,而使用不同的字节序。但是最终的结果都是相同的,不过计算方式却有很大的不同

 

Int 和 bigint
一旦我找到字节序的规律和行压缩整型值的数值架构,int和bigint的实现就很简单了。和其他类型一样,他们也是可变长度的所以你有可能会碰到5字节长的bigint值和1字节长的int值。下面是SqlBigInt 类型的主要解析代码

 

<span>switch</span><span> (value.Length)
{
    </span><span>case</span> <span>0</span><span>:
        </span><span>return</span> <span>0</span><span>;

    </span><span>case</span> <span>1</span><span>:
        </span><span>return</span> (<span>long</span>)(-<span>128</span> + value[<span>0</span><span>]);

    </span><span>case</span> <span>2</span><span>:
        </span><span>return</span> (<span>long</span>)(-<span>32768</span> + BitConverter.ToUInt16(<span>new</span>[] { value[<span>1</span>], value[<span>0</span>] }, <span>0</span><span>));

    </span><span>case</span> <span>3</span><span>:
        </span><span>return</span> (<span>long</span>)(-<span>8388608</span> + BitConverter.ToUInt32(<span>new</span> <span>byte</span>[] { value[<span>2</span>], value[<span>1</span>], value[<span>0</span>], <span>0</span> }, <span>0</span><span>));

    </span><span>case</span> <span>4</span><span>:
        </span><span>return</span> (<span>long</span>)(-<span>2147483648</span> + BitConverter.ToUInt32(<span>new</span>[] { value[<span>3</span>], value[<span>2</span>], value[<span>1</span>], value[<span>0</span>] }, <span>0</span><span>));

    </span><span>case</span> <span>5</span><span>:
        </span><span>return</span> (<span>long</span>)(-<span>549755813888</span> + BitConverter.ToInt64(<span>new</span> <span>byte</span>[] { value[<span>4</span>], value[<span>3</span>], value[<span>2</span>], value[<span>1</span>], value[<span>0</span>], <span>0</span>, <span>0</span>, <span>0</span> }, <span>0</span><span>));

    </span><span>case</span> <span>6</span><span>:
        </span><span>return</span> (<span>long</span>)(-<span>140737488355328</span> + BitConverter.ToInt64(<span>new</span> <span>byte</span>[] { value[<span>5</span>], value[<span>4</span>], value[<span>3</span>], value[<span>2</span>], value[<span>1</span>], value[<span>0</span>], <span>0</span>, <span>0</span> }, <span>0</span><span>));

    </span><span>case</span> <span>7</span><span>:
        </span><span>return</span> (<span>long</span>)(-<span>36028797018963968</span> + BitConverter.ToInt64(<span>new</span> <span>byte</span>[] { value[<span>6</span>], value[<span>5</span>], value[<span>4</span>], value[<span>3</span>], value[<span>2</span>], value[<span>1</span>], value[<span>0</span>], <span>0</span> }, <span>0</span><span>));

    </span><span>case</span> <span>8</span><span>:
        </span><span>return</span> (<span>long</span>)(-<span>9223372036854775808</span> + BitConverter.ToInt64(<span>new</span>[] { value[<span>7</span>], value[<span>6</span>], value[<span>5</span>], value[<span>4</span>], value[<span>3</span>], value[<span>2</span>], value[<span>1</span>], value[<span>0</span>] }, <span>0</span><span>));

    </span><span>default</span><span>:
        </span><span>throw</span> <span>new</span> ArgumentException(<span>"</span><span>Invalid value length: </span><span>"</span> +<span> value.Length);
}</span>
로그인 후 복사

可变长度的值是一个包含字节数据的字节数组存储在磁盘上。如果长度是0,没有东西存储因此我们知道他的值为0。

对于每一个剩余的有效长度,简单的使用最小的显示值作为偏移并且添加上存储的值

对于非压缩值我们可以使用BitConverter 类直接将输入值使用系统字节序转为期望值,对于大多数的英特尔和AMD系统,一般都是小字节序(意味着OrcaMDF 不会运行在一个大字节序的系统上)。然而,当压缩值使用大字节序进行压缩,我必须重新映射输入的数组为小端字节格式,并且在字节尾补上0 以便匹配short,int和long的大小


对于shorts和ints 我将无符号数值读取进来,因为这是我所感兴趣的。工作原理是将int 和uint强制转换为long值。我不能对long类型做同样的事情因为没有其他数据类型比long 更大了。对于long的最大值为9.223.372.036.854.775.807,在磁盘里实际存储为0xFFFFFFFFFFFFFFFF。解析有符号long型使用BitConverter得出的结果 -1 由于会导致溢出。由于额外的负数溢出这有可能会导致出错

-<span>9.223</span>.<span>372.036</span>.<span>854.775</span>.<span>808</span> + <span>0xFFFFFFFFFFFFFF</span> =>
-<span>9.223</span>.<span>372.036</span>.<span>854.775</span>.<span>808</span> + -<span>1</span> =
<span>9.223</span>.<span>372.036</span>.<span>854.775</span>.<span>807</span>
로그인 후 복사

 

结论
通常我有很多的有趣的尝试通过执行一个select语句去找出数值在磁盘上以哪一个字节结束。
这不会花很长的时间去实现,技术内幕的书只是作为引导,还有很多东西需要我们深入挖掘

 

第十三篇完

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

mdf 파일을 sqlserver로 가져오는 방법 mdf 파일을 sqlserver로 가져오는 방법 Apr 08, 2024 am 11:41 AM

가져오기 단계는 다음과 같습니다. MDF 파일을 SQL Server의 데이터 디렉터리(일반적으로 C:\Program Files\Microsoft SQL Server\MSSQL\DATA)에 복사합니다. SSMS(SQL Server Management Studio)에서 데이터베이스를 열고 연결을 선택합니다. 추가 버튼을 클릭하고 MDF 파일을 선택합니다. 데이터베이스 이름을 확인하고 확인 버튼을 클릭합니다.

sqlserver 데이터베이스에 이름이 지정된 개체가 이미 존재하는 문제를 해결하는 방법 sqlserver 데이터베이스에 이름이 지정된 개체가 이미 존재하는 문제를 해결하는 방법 Apr 05, 2024 pm 09:42 PM

SQL Server 데이터베이스에 이미 존재하는 동일한 이름을 가진 개체의 경우 다음 단계를 수행해야 합니다. 개체 유형(테이블, 뷰, 저장 프로시저)을 확인합니다. IF NOT EXISTS를 사용하면 객체가 비어 있는 경우 생성을 건너뛸 수 있습니다. 개체에 데이터가 있는 경우 다른 이름을 사용하거나 구조를 수정하세요. 기존 개체를 삭제하려면 DROP을 사용하세요. 주의하세요. 백업을 권장합니다. 삭제되거나 이름이 바뀐 개체에 대한 참조가 없는지 확인하려면 스키마 변경 사항을 확인하세요.

sqlserver에서 실수로 삭제한 데이터베이스를 복구하는 방법 sqlserver에서 실수로 삭제한 데이터베이스를 복구하는 방법 Apr 05, 2024 pm 10:39 PM

실수로 SQL Server 데이터베이스를 삭제한 경우 다음 단계를 수행하여 복구할 수 있습니다. 데이터베이스 활동 중지, 데이터베이스 로그 확인, 백업에서 복원, DBCC CHECKDB 사용 파티 도구. 데이터 손실을 방지하려면 데이터베이스를 정기적으로 백업하고 트랜잭션 로깅을 활성화하십시오.

sqlserver 포트번호 확인하는 방법 sqlserver 포트번호 확인하는 방법 Apr 05, 2024 pm 09:57 PM

SQL Server 포트 번호를 보려면 SSMS를 열고 서버에 연결합니다. 개체 탐색기에서 서버 이름을 찾아 마우스 오른쪽 단추로 클릭하고 속성을 선택합니다. 연결 탭에서 TCP 포트 필드를 확인하세요.

sqlserver 서비스를 시작할 수 없는 경우 수행할 작업 sqlserver 서비스를 시작할 수 없는 경우 수행할 작업 Apr 05, 2024 pm 10:00 PM

SQL Server 서비스가 시작되지 않는 경우 해결해야 할 몇 가지 단계는 다음과 같습니다. 오류 로그를 확인하여 근본 원인을 확인합니다. 서비스 계정에 서비스를 시작할 수 있는 권한이 있는지 확인하세요. 종속성 서비스가 실행 중인지 확인하세요. 바이러스 백신 소프트웨어를 비활성화합니다. SQL Server 설치를 복구합니다. 복구가 작동하지 않으면 SQL Server를 다시 설치하십시오.

sqlserver 데이터베이스는 어디에 있나요? sqlserver 데이터베이스는 어디에 있나요? Apr 05, 2024 pm 08:21 PM

SQL Server 데이터베이스 파일은 일반적으로 다음 기본 위치에 저장됩니다. Windows: C:\Program Files\Microsoft SQL Server\MSSQL\DATALinux: /var/opt/mssql/data 데이터베이스 파일 경로를 수정하여 데이터베이스 파일 위치를 사용자 정의할 수 있습니다. 환경.

Java 연결 SqlServer 오류를 해결하는 방법 Java 연결 SqlServer 오류를 해결하는 방법 May 01, 2023 am 09:22 AM

이번에는 이전에 사용하지 않았던 SqlServer 데이터베이스를 사용하고 있었는데 문제가 심각하지 않다는 것을 발견하였고, 요구사항 문서의 단계에 따라 SqlServer를 연결한 후 SpringBoot 프로젝트를 시작하여 찾았습니다. 처음에는 SQLServer 연결에 문제가 있는 줄 알고 데이터베이스를 확인하러 갔는데, 데이터베이스에 있는 모든 것이 정상인지 먼저 동료들에게 그런 문제가 있는지 물어봤습니다. 그렇지 않다는 것을 알았기 때문에 저는 Baidu 프로그래밍을 시작했습니다. 제가 해결하기 시작한 구체적인 오류 메시지는 이것이었기 때문에 Baidu 오류 보고를 시작했습니다: ERRORc.a.d.p.DruidDataSource$CreateCo

설치에 실패하면 sqlserver를 삭제하는 방법은 무엇입니까? 설치에 실패하면 sqlserver를 삭제하는 방법은 무엇입니까? Apr 05, 2024 pm 11:27 PM

SQL Server 설치가 실패하면 다음 단계에 따라 정리할 수 있습니다. SQL Server 제거 레지스트리 키 삭제 파일 및 폴더 삭제 컴퓨터를 다시 시작합니다.

See all articles