名前が示すように、B ツリー構造を持つインデックスは B ツリー インデックスであり、通常の状況では、InnoDb エンジンで作成される従来のインデックスはすべてB ツリー構造。
B ツリーのインデックスは次のとおりです。
主キーを定義する場合、主キーに自動的に追加されるインデックスがクラスター化インデックス (クラスター化インデックスとも呼ばれます) です。
Mysql では、コンポーネントを使用して B ツリー構造を構築しており、図に示すように、各リーフ ノードは主キーおよびその他の関連データに対応します。
テーブルの作成時に主キーを定義しない場合、Mysql は主キーと対応するインデックスを自動的に作成します。主キーの名前は rowId# です。
一般的なセカンダリ インデックスは次のステートメントで作成されます:
CREATE INDEX order_name_index on t_order(order_name);
複合インデックスは次のステートメントで作成されます:
CREATE INDEX order_name_and_order_type_index on t_order(order_name, order_type);
たとえば、定義ステートメントは次のとおりです。
CREATE INDEX joint_index on t_order(order_name, order_type, submit_time);
order_name をソートし、
order_name の場合はソートします。 が同じである場合、
order_type を並べ替えると、最後の行は
submit_time になります。
where 句または
order by およびその他の句が試行されます。 ## で始める #order_name
で始める、など。 たとえば、上記の 3 つの列で構成される複合インデックスを定義しました。クエリまたは並べ替えを行うときは、最初に
、次に order_type
、最後に#を試してみてください。 ##submit_time。
select * from t_order where order_name = 'order1' and order_type = 1 and submit_time = str_to_date('2022-08-02 00:52:26', '%Y-%m-%d %T')
理由は非常に簡単です。ジョイント インデックスのソート ルールは、最初に
order_name をソートし、order_name が同じ場合は、次に
order_type をソートするためです。 、最後に
submit_time。したがって、クエリの並べ替え時にこのルールに従った場合にのみ、インデックスを使用できます。
たとえば、左端の原則に完全に準拠していない場合、クエリの並べ替えでは 2 つの列のみが配置され、中央の
order by order_name、submit_time
1.3.3. ジョイントインデックスのクエリ最適化
show index from t_order;
によって返されたフィールドを確認してください。結合インデックスを構成する列と主キーのみを返すようにしてください。テーブルの破損を避けるために、他の列は返さないでください。戻る。 ジョイント インデックスの B ツリーのリーフ ノードには、主キーとジョイント インデックスを構成する列の値のみが含まれるため、これは理解しやすいはずです。返されるフィールドがこれらのみの場合列が完成すると、B ツリーのクエリが完了します。他の列を返したい場合は、主キーのインデックスを検索し、テーブルを返す操作を実行する必要があります。
2. ハッシュ インデックス
show engine innodb status;
status ハッシュインデックスの状況を含む多くの情報があります。情報をエディタにコピーして表示してみましょう。このセクションはハッシュ インデックス情報です。
------------------------------------- INSERT BUFFER AND ADAPTIVE HASH INDEX ------------------------------------- Ibuf: size 1, free list len 0, seg size 2, 0 merges merged operations: insert 0, delete mark 0, delete 0 discarded operations: insert 0, delete mark 0, delete 0 Hash table size 34679, node heap has 0 buffer(s) Hash table size 34679, node heap has 0 buffer(s) Hash table size 34679, node heap has 5 buffer(s) Hash table size 34679, node heap has 0 buffer(s) Hash table size 34679, node heap has 1 buffer(s) Hash table size 34679, node heap has 0 buffer(s) Hash table size 34679, node heap has 1 buffer(s) Hash table size 34679, node heap has 1 buffer(s) -- 哈希索引的命中率,可根据这个来决定是否使用哈希索引 0.00 hash searches/s, 0.00 non-hash searches/s ---
因为B+树也是占用空间的,所以在固定空间中,如果列的类型占用的空间越小,那我们一次就能读取更多的B+树节点,这样自然就加快了效率。
离散性是指数据的值重复的程度高不高,假如有N条数据的话,那离散性就可以用数值表示,范围是1/N 到 1。
比如说某个列在数据库中有下面几条数据(1, 2, 3, 4, 5, 5, 3),其中5和3都有重复,去重后应该是(1, 2, 3, 4, 5)。我们将去重后的条数除以总条数就得到离散性。这里是5/7。列中重复数据较多时,对应的数值较小,而重复数据较少时,数值相应较大。
如果一个列的数据的重复性越低,那么这个列就越适合加索引。
因为索引是需要起到筛选的作用。比如我们有个where
条件是where id = 1
,如果数据重复性较高,那可能根据索引会返回100条数据,然后我们在根据其他where
条件在100条数据中再筛选。
如果数据重复性较低,那可能就只返回1条数据,那之后的运算量明显小得多。
所以一个列的数据离散性越高,那这个列越适合添加索引。
我们可以用下面的语句得到某个列的离散性程度。
select count(distinct id)/count(*) form t_table;
前缀索引和后缀索引:
有些列的值比较长,比如一些备注日志信息也会记录在数据库当中,这类信息的长度往往比较长,如果我们需要对这类列加索引,那索引并不是索引字符串的全部长度。这时候我们就可以建立前缀索引,即对字符串的前面几位建立索引。
所以前缀索引就是建立范围更小索引,选择一个好前缀位数就能有一个更好的查询效率。
不过有一些缺点,就是这类索引无法应用到order by
和group
语句上。
Mysql没有后缀索引,如果非要实现后缀索引,那在数据存储时我们应该将数据反转,这样就能用前缀索引达到后缀索引的效果。后缀索引的一个经典应用就是邮箱,快速查询某种类型的邮箱。
选择前缀索引的位数:
这里的逻辑和列的离散性类似,我们需要看看字符串的前面几位的子字符串的离散性如何。比如对于下面的表,内容是电影票的相关信息,我们需要对order_note
建立前缀索引。
来比较一下各个位的子字符串的离散性。
SELECT COUNT(DISTINCT LEFT(order_note,3))/COUNT(*) AS sel3, COUNT(DISTINCT LEFT(order_note,4))/COUNT(*)AS sel4, COUNT(DISTINCT LEFT(order_note,5))/COUNT(*) AS sel5, COUNT(DISTINCT LEFT(order_note, 6))/COUNT(*) As sel6, COUNT(DISTINCT LEFT(order_note, 7))/COUNT(*) As sel7, COUNT(DISTINCT LEFT(order_note, 8))/COUNT(*) As sel8, COUNT(DISTINCT LEFT(order_note, 9))/COUNT(*) As sel9, COUNT(DISTINCT LEFT(order_note, 10))/COUNT(*) As sel10, COUNT(DISTINCT LEFT(order_note, 11))/COUNT(*) As sel11, COUNT(DISTINCT LEFT(order_note, 12))/COUNT(*) As sel12, COUNT(DISTINCT LEFT(order_note, 13))/COUNT(*) As sel13, COUNT(DISTINCT LEFT(order_note, 14))/COUNT(*) As sel14, COUNT(DISTINCT LEFT(order_note, 15))/COUNT(*) As sel15, COUNT(DISTINCT order_note)/COUNT(*) As total FROM order_exp;
![在这里插入图片描述](https://img-blog.csdnimg.cn/33a12fadd99944098e91f883d6bfaa2f.png #pic_center =x80)
可以看出,前面几位的子字符串的离散程度较低,后面sel13
开始就比较高,那我们可以根据实际情况,建立13~15位的前缀索引。
建立前缀索引SQL语句:
alter table order_exp add key(order_note(13));
这个理由很简单,不解释了。
原因很简单,查询时根据定义复合索引时的列的顺序来查询的,离散性高的列放在前面的话,就能更早的将更多的数据排除在外。
三星索引是一种策略。有三种条件,满足一条则索引获得一颗星,三颗星则是很好的索引。
三条策略分别是
索引将相关记录放在一起。
意思是查询需要的数据在索引树的叶子节点中连续或者足够靠近。举个例子,下面是某个索引的B+树。查询所需数据仅在叶节点的前两个范围内,即0000至a。这很明显,后面的片我们就没必要再去查询了,这无疑增加了效率。当所需数据分布在每个片上时,查询次数就会显著增加。
所以查询需要的数据在叶子节点上越连续,越窄就越好。
索引中的数据顺序与查找中的数据排序一致。
这容易理解,讲解联合索引中说过,B+树的排序顺序和索引中的数据一样,所以查询时的where
的数据顺序越贴近索引中的顺序,就越能更好地利用B+树。
索引的列包含查询中的所有列。
这个可以避免回文操作,不多解释。
三星索引的权重:
一般来说第三个策略权重占到50%,之后是第一个策略27%, 第二个策略23%。
三星索引实例:
CREATE TABLE customer ( cno INT, lname VARCHAR (10), fname VARCHAR (10), sex INT, weight INT, city VARCHAR (10) ); CREATE INDEX idx_cust ON customer (city, lname, fname, cno);
我们创建以上的索引,那么对于下面的查询语句,这个索引就是三星索引。
select cno,fname from customer where lname='xx' and city ='yy' order by fname;
首先,查询条件中有lname=’xx’ and city =’yy’
,这条件让我们这需要在lname=’xx’ and city =’yy’
的那一片B+树的叶子节点中查询,让我们的查询变窄了很多,并且这部分的数据是连续的,因为B+树是先根据city
排序,再根据lname
查询。
另外,因为已经锁定lname=’xx’ and city =’yy’
,所以这部分的数据是根据fname和cno
排序。查询语句正好是根据`fname```排序,所以第二点也满足。
最后是查询的结果都包含正在索引中,不会有回文,第三点也满足,所以这个索引是三星索引。
以上がMySQL インデックスを作成する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。