内存列式存储 vs Buffer Cache-mysql チュートリアル-php.cn

内存列式存储和Buffer Cache的访问模式

列存储格式

SIMD

storage index

压缩

内存中Join和Aggregation的优化

参考

ホームページ

データベース

mysql チュートリアル

内存列式存储 vs Buffer Cache

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 07, 2016 pm 02:49 PM

1 buffer cache oracle メモリストレージ

Oracle DB 12c的In-Memory选项(DBIM)将表中列的所有行的数据载入内存，为何不能像Buffer Cache那样只把频繁访问的数据块置入内存中呢? 内存列式存储和Buffer Cache的访问模式原因是两者支持的访问模式不同，对于Buffer Cache，支持的是OLTP应用，访问模式为

Oracle DB 12c的In-Memory选项(DBIM)将表中列的所有行的数据载入内存，为何不能像Buffer Cache那样只把频繁访问的数据块置入内存中呢?

内存列式存储和Buffer Cache的访问模式

原因是两者支持的访问模式不同，对于Buffer Cache，支持的是OLTP应用，访问模式为non-uniform access patterns，也就是说表中的某些行访问比其它行频繁，因此才能通过只缓存10%的数据，就可以涵盖95%的数据访问。可以假设缓存10%的数据就可以得到20倍的性能提升。

而内存列式存储支持的是分析型应用，访问的是少数列，但却需要扫描表中所有行的数据。缓存部分行的数据意义不大，例如如果内存列式存储可以得到100倍性能提升，如果只缓存表中10%的数据只能得到1.1倍的性能提升，而不是100倍。所以在DBIM的设置中，你可以指定全表，表中的部分列，部分分区，表空间，但你无法用where条件指定只缓存列中的部分行。

所以对于分析性的应用，之所以内存列式存储比行式存储（即使是通过alter table tablename cache 全部缓存到内存）快，最重要的原因就是列存储的格式非常适合分析性应用。

列存储格式

以下的图很好的说明了为何列式存储适合分析。
如果采用传统的行式存储来进行分析，例如查询第4列，这时需要逐行访问，需要查询第1到第3列这些无关数据。

如果是采用列式存储，则只需要访问第4列即可，避免了无效I/O，效率自然提升了。

看一下Oracle在Open World 2013上发布的测试结果：

行式和列式都是在内存中，DBIM快了近800倍，单个core每1/6秒处理30亿行数据，难以置信?!

SIMD

这时以前在高性能计算和图像处理中使用的技术，即Single Instruction Multiple Data，其实就是对于数据的批处理，只不过其非常适合列式数据。

storage index

storage index其实在Exadata中就有了，其实就是将列分区为IMCU，预先计算和实时维护好每一个IMCU中的最大和最小值，查询时匹配where条件，就可以跳过许多无关的IMCU，从而节省I/O和时间。原理上和分区是类似的。
不过数据库重启后需要重新计算。

压缩

列式存储通常都会压缩，因为其中的数据重复值较多，DBIM中压缩是缺省的选项。
压缩不仅可以在内存中缓存更多的数据，而且还可以减少I/O。不过考虑到如果有较多OLTP的访问，这时不要选取压缩比较高的压缩方式，以免压缩和解压时消耗过多的资源。

内存中Join和Aggregation的优化

通过Bloom Filter将Join转换为列扫描可以加快Join速度，在内存中更是如此。
而通过key vector，原理与Bloom Filter类似，也可以在线构建聚集表的结果，具体原理看白皮书。

参考

In-Memory Column Store versus the Buffer Cache

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

ホットトピック

Gmailメールのログイン入り口はどこですか？

7804

Java チュートリアル

1645

CakePHP チュートリアル

1402

Laravel チュートリアル

1300

PHP チュートリアル

1236

Related knowledge

オラクルを開けない場合はどうすればよいですか Apr 11, 2025 pm 10:06 PM

Oracleのソリューションを開くことはできません。1。データベースサービスを開始します。 2。リスナーを開始します。 3.ポートの競合を確認します。 4.環境変数を正しく設定します。 5.ファイアウォールまたはウイルス対策ソフトウェアが接続をブロックしないことを確認してください。 6.サーバーが閉じているかどうかを確認します。 7. RMANを使用して破損したファイルを回復します。 8。TNSサービス名が正しいかどうかを確認します。 9.ネットワーク接続を確認します。 10。Oracleソフトウェアを再インストールします。

Oracle Cursorを閉じる問題を解決する方法 Apr 11, 2025 pm 10:18 PM

Oracle Cursorの閉鎖問題を解決する方法には、次のものが含まれます。 Scopeが終了した後に自動的に閉じるように、for update句のカーソルを宣言します。使用句のカーソルを宣言して、関連するPL/SQL変数が閉じられたときに自動的に閉じるようにします。例外処理を使用して、例外の状況でカーソルが閉じていることを確認します。接続プールを使用して、カーソルを自動的に閉じます。自動送信を無効にし、カーソルの閉鎖を遅延させます。

Oracle Loopでカーソルを作成する方法 Apr 12, 2025 am 06:18 AM

Oracleでは、forループループは動的にカーソルを作成できます。手順は次のとおりです。1。カーソルタイプを定義します。 2。ループを作成します。 3.カーソルを動的に作成します。 4。カーソルを実行します。 5。カーソルを閉じます。例：カーソルをサイクルごとに作成して、上位10人の従業員の名前と給与を表示できます。

Oracleデータベースを停止する方法 Apr 12, 2025 am 06:12 AM

Oracleデータベースを停止するには、次の手順を実行します。1。データベースに接続します。 2。すぐにシャットダウンします。 3.シャットダウンは完全に中止します。

Oracleデータベースをページングする方法 Apr 11, 2025 pm 08:42 PM

Oracle Database Pagingは、Rownum Pseudo-ColumnsまたはFetchステートメントを使用して実装しています。RownumPseudo-Columnsは、行番号ごとに結果をフィルタリングするために使用され、複雑なクエリに適しています。 Fetchステートメントは、指定された最初の行を取得するために使用され、単純なクエリに適しています。

HDFSでCentosを構成するために必要な手順 Apr 14, 2025 pm 06:42 PM

CENTOSシステムにHadoop分散ファイルシステム（HDFS）を構築するには、複数のステップが必要です。この記事では、簡単な構成ガイドを提供します。 1.初期段階でJDKをインストールする準備：すべてのノードにJavadevelopmentKit（JDK）をインストールすると、バージョンはHadoopと互換性がある必要があります。インストールパッケージは、Oracleの公式Webサイトからダウンロードできます。環境変数構成： /etc /プロファイルファイルを編集し、JavaおよびHadoop環境変数を設定して、システムがJDKとHadoopのインストールパスを見つけることができるようにします。 2。セキュリティ構成：SSHパスワードなしログインSSHキーを生成する：各ノードでSSH-KeyGenコマンドを使用する

Oracle Dynamic SQLを作成する方法 Apr 12, 2025 am 06:06 AM

SQLステートメントは、Oracleの動的SQLを使用して、ランタイム入力に基づいて作成および実行できます。手順には、次のものが含まれます。動的に生成されたSQLステートメントを保存するための空の文字列変数を準備します。 executeを即座に使用するか、ステートメントを準備して、動的なSQLステートメントをコンパイルおよび実行します。バインド変数を使用して、ユーザー入力またはその他の動的値を動的SQLに渡します。実行するか、実行するか、動的SQLステートメントを実行します。

Oracleログがいっぱいの場合はどうすればよいですか Apr 12, 2025 am 06:09 AM

Oracleログファイルがいっぱいになると、次のソリューションを採用できます。1）古いログファイルをクリーンします。 2）ログファイルサイズを増やします。 3）ログファイルグループを増やします。 4）自動ログ管理をセットアップします。 5）データベースを再発射化します。ソリューションを実装する前に、データの損失を防ぐためにデータベースをバックアップすることをお勧めします。

See all articles

内存列式存储 vs Buffer Cache

内存列式存储和Buffer Cache的访问模式

列存储格式

SIMD

storage index

压缩

内存中Join和Aggregation的优化

参考

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック