在有些时候，需要使用长字符串作为索引，这样的索引由于占用的空间比较大，以及排序的时候值之间的比较会花费很多的时间，效率会比较低。对于这种情况可以只使用这个字段的前N个字符作为索引的值，这种策略就叫做”前缀索引”。比如，在MYSQL中如果需要使用BLOB/TEXT类型的字段作为索引的话，那么必须使用前缀索引，因为这几种类型不允许作为索引。

使用“前缀索引”会带来选择性的问题，比如某张表的长字段索引记录如下,如果采用整个字段的值作为索引的值的话虽然效率很低，但是匹配到最后应该只有一条记录与之相符，这种情况下选择性为1，是最高的。如果采用4个字符作为前缀，那么其实这个索引也就失去了价值，因为它的数量和表记录的数量是相等的，不管怎么优化，做的也都是全表扫描。所以前缀长度的选择非常的重要

ABCDEFGHIJKDDD8

ABCDEFFSKDJKJKD7

ABCDKJH65654654K

ABCDEFGHIJKKJKJG

ABCDEFGHIJKFFFFEJ

可以采取以下方式确定前缀长度,应用别的书籍上的例子,这个例子中city是索引字段

2.1 首先确定整个表索引值的选择率：

select count(distinct city)/ count(*) from City_Demo;

假设执行的结果是0.0312

2.2 算出几个候选长度的选择率

SELECT COUNT(DISTINCTLEFT(city, 3))/COUNT(*) AS sel3,

COUNT(DISTINCT LEFT(city,4))/COUNT(*) AS sel4,

COUNT(DISTINCT LEFT(city,5))/COUNT(*) AS sel5,

COUNT(DISTINCT LEFT(city,6))/COUNT(*) AS sel6,

COUNT(DISTINCT LEFT(city,7))/COUNT(*) AS sel7

FROM city_demo;

+--------+--------+--------+--------+--------+

| sel3 | sel4 | sel5 | sel6| sel7 |

+--------+--------+--------+--------+--------+

| 0.0239 | 0.0293 | 0.0305 | 0.0309 | 0.0310 |

2.3 选一个最靠近的值，从比较的结果看，应该选7作为前缀的长度

2.4 接下来创建这个前缀索引

ALTER TABLE sakila.city_demo ADD KEY (city(7));

最后要指出的是“前缀索引”的缺点：MYSQL无法使用前缀索引做orderby,group by, 以及覆盖索引（后面会提到）

3 组合索引中字段的顺序问题

在创建B-Tree的组合索引时，由于B-Tree的匹配顺序是按照存储的顺序来比较的，所以说如果前面的字段可以过滤掉更多的记录的话，后面的条件就会比较更少的记录，当然效率也就更高，用下面的组合索引做个简单的解释

NAME

AREA

如果把NAME放在第一个位置，那么在用AREA进行比较时，可能只用10条记录需要比较，如果把AREA放在第一个位置，那么在用NAME进行比较是，可能会有1000条记录需要比较，可以简单的推断出需要把NAME放在索引的第一列，这个原理决定了Hash索引是不适用该规则的。

上面的小例子，可以通过字段的选择率来确定索引的字段顺序，转换成SQL的表示方式如下,

SELECT COUNT(DISTINCT NAME)/COUNT(*) AS name_selectivity,

COUNT(DISTINCT AREA)/COUNT(*) AS area_selectivity,

COUNT(*)

FROM student\G

*************************** 1. row***************************

area_selectivity: 0.0001

name_selectivity: 0.0373

COUNT(*): 16049

结论：把结果中选择率高的字段放在组合的前面

4 聚合索引(Cluster Indexes)

首先要说明的是“聚合索引”并不是指某种具体的索引类型，而是指索引数据的存储方式。其具体的实现细节和数据库引擎实现紧密相关，基本的思想是”将索引和数据行保存在一个数据结构中，且数据行和相邻的键值存储在一起”。如果查询的结果都可以被索引覆盖的话，就不需要再回数据库中进行数据的检索。

在Oracle中，可以显示的指定哪些索引为聚合索引。在目前版本的MySQL中，各个存储引擎还不能通过“任意指定”的方式来设置聚合索引。在InnoDB中默认的情况会使用主键作为聚合索引，如果没有建立主键，会选择一个“非空且唯一”的索引来代替，如果 “非空且唯一”的索引也不存在，它会自定义一个主键作为聚合索引。

最后需要指出的是，因为这种存储方式中，相邻键值的数据行是存储在一起的，所以应该尽量采用键值递增的插入方式。

如果是使用UUID这种随机的主键，会导致大量的随机IO访问，插入效率会很低

5 覆盖索引（Converting Indexes）

覆盖索引是指：索引的字段包含了所有要查询的字段，就成为覆盖索引。

例如Student表中在(Name,Area)上建立了索引：

则 select name,area from student wherename=’Eric’ 这样的查询就成为是被索引覆盖的，从执行计划上看，如果EXPLAIN一条查询的Extra列包含“Using Index”就说明这条查询被索引覆盖了。

通常情况下利用索引查询到记录的时候，首先会查询到索引的Node,然后根据索引Node中存储的记录指针再到数据库的中查找记录，这种方式也就相当于进行了两次查询，而且数据库记录查询的效率往往会比较低。覆盖索引由于它本身就包含了要查询的字段值，也就避免了对数据库记录的访问，从而极大的提高了查询的效率。

有一点需要注意，因为覆盖索引用到的是索引字段的值，而“Hash/空间/全文” 索引中并没有存储索引字段的实际值，所以他们是不支持覆盖索引的。

关于覆盖索引，除了上面提出的问题外，还需要注意MYSQL的版本问题。MYSQL5.5以后的版本对该特性提供了更好的支持，所以尽可能还是使用最新的版本。

6 索引顺序扫描排序

MYSQL 可以按照索引顺序扫描(Explain 中的type为index)以及排序操作来实现排序功能。

如果使用了索引顺序扫描以及覆盖索引可以使排序的速度大大的提高，如果索引不能包含所有要查询的列，则在取每条记录值的时候都需要根据记录指针去查找对应的记录，这有可能会带来大量的随机I/O的产生，从而使查询效率下降。所以在设计索引的时候，既要考虑到查询条件，也要考虑到排序操作

为了使索引更好的服务于排序动作，在拼写SQL的过程中有以下几个问题需要注意

(1) 使用“覆盖索引”

(2) 索引的顺序和order by的顺序一致，且所有列的排序方向一致

(3) 多表关联排序时，order by的条件字段全部都是第一个表的

(4) Order by 和where一样，也要遵守“最左原则“

(5) 如果where或者join中指定了某个列为常量，则可以弥补规则(4),

例如 INDEX(Name,Age,ID) 则 ….where name=”Eric” order by age, id 也可以使用索引顺序扫描排序

7 轻便的索引

MYSQL允许在相同的Column上创建多个索引，MYSQL需要单独维护每个重复的索引，而且查询优化器也会在这些重复的索引上花时间，从而可能导致整体性能的下降。

所以应该尽量保持索引的"轻便"

· 重复的索引

定义:在相同的列上，按照相同的顺序，创建相同类型的索引。

例如下面的语句将在ID上创建三个索引，对于Primary KEY而言，UNIQUE以及INDEX都是重复的

Create table test(

 ID int not null PRIMARY KEY,

 UNIQUE(ID),

 INDEX(ID),

)

로그인 후 복사

· 冗余的索引

这里的“冗余“指的是多个索引有着相同的类型，且功能重复。

例如对于B-Tree索引而言，如果创建了索引(A,B),再创建索引(A),则(A)就被认为是重复的，但是如果创建了(B)则不被认为是冗余的。

冗余的索引一般是发生在扩展的索引的时候，例如已经存在了一个索引(A),有人为了满足新的查询需求，创建了一个新的索引(A,B),这个时候(A)就成了冗余的索引，应该进行删除，或者是用(A)来扩展成(A,B)

有时候冗余的索引也能带来查询性能上的提升，例如当需要向索引中添加了一个超长的字符串字段，因为这个字段会导致索引存储空间的变大，导致了查询效率的降低，所以适当的使用冗余索引对性能会有帮助。

可以通过对INFORMATION_SCHEMA中的数据来判断索引是否是重复/冗余，也可以通过专门的工具例如Percona-Toolkit的pt-duplicate-key-checker 来检测(http://www.percona.com/doc/percona-toolkit/2.1/pt-duplicate-key-checker.html)

· 未使用的索引

和前面两种情况类似，当系统中存在大量未使用的索引时，同样对查询的效率会有影响，可以通过以下两种方式来判断那些索引时未使用的

（1）在Percona或者是MariaDB中，通过打开userstates服务器变量，然后正常运行一段时间，最后通过INFORMATION_SCHEMA.INDEX_STATISTICS变量来判断

（2）通过专门的工具，例如Percona-Toolkit的pt-index-usage来判断，该工具不仅可以查出那些索引是没有被使用的，还可以了解查询的执行计划(http://www.percona.com/doc/percona-toolkit/2.1/pt-index-usage.html)

需要注意的是，并不是未使用的索引就是没有用的索引，例如有些索引的功能是唯一性约束，虽然该索引一直没有被使用，但是却可以避免产生重复的数据，这种类型的索引在处理的时候需要小心

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

뜨거운 도구

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7476

Cakephp 튜토리얼

1377

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

Related knowledge

MySQL : 초보자를위한 데이터 관리의 용이성 Apr 09, 2025 am 12:07 AM

MySQL은 설치가 간단하고 강력하며 데이터를 쉽게 관리하기 쉽기 때문에 초보자에게 적합합니다. 1. 다양한 운영 체제에 적합한 간단한 설치 및 구성. 2. 데이터베이스 및 테이블 작성, 삽입, 쿼리, 업데이트 및 삭제와 같은 기본 작업을 지원합니다. 3. 조인 작업 및 하위 쿼리와 같은 고급 기능을 제공합니다. 4. 인덱싱, 쿼리 최적화 및 테이블 파티셔닝을 통해 성능을 향상시킬 수 있습니다. 5. 데이터 보안 및 일관성을 보장하기위한 지원 백업, 복구 및 보안 조치.

Navicat에서 데이터베이스 비밀번호를 검색 할 수 있습니까? Apr 08, 2025 pm 09:51 PM

Navicat 자체는 데이터베이스 비밀번호를 저장하지 않으며 암호화 된 암호 만 검색 할 수 있습니다. 솔루션 : 1. 비밀번호 관리자를 확인하십시오. 2. Navicat의 "비밀번호 기억"기능을 확인하십시오. 3. 데이터베이스 비밀번호를 재설정합니다. 4. 데이터베이스 관리자에게 문의하십시오.

Navicat Premium을 만드는 방법 Apr 09, 2025 am 07:09 AM

Navicat Premium을 사용하여 데이터베이스 생성 : 데이터베이스 서버에 연결하고 연결 매개 변수를 입력하십시오. 서버를 마우스 오른쪽 버튼으로 클릭하고 데이터베이스 생성을 선택하십시오. 새 데이터베이스의 이름과 지정된 문자 세트 및 Collation의 이름을 입력하십시오. 새 데이터베이스에 연결하고 객체 브라우저에서 테이블을 만듭니다. 테이블을 마우스 오른쪽 버튼으로 클릭하고 데이터 삽입을 선택하여 데이터를 삽입하십시오.

MariaDB 용 Navicat에서 데이터베이스 비밀번호를 보는 방법은 무엇입니까? Apr 08, 2025 pm 09:18 PM

MariaDB 용 Navicat은 암호가 암호화 된 양식으로 저장되므로 데이터베이스 비밀번호를 직접 볼 수 없습니다. 데이터베이스 보안을 보장하려면 비밀번호를 재설정하는 세 가지 방법이 있습니다. Navicat을 통해 비밀번호를 재설정하고 복잡한 비밀번호를 설정하십시오. 구성 파일을 봅니다 (권장되지 않음, 위험이 높음). 시스템 명령 줄 도구를 사용하십시오 (권장되지 않으면 명령 줄 도구에 능숙해야 함).

Navicat에서 SQL을 실행하는 방법 Apr 08, 2025 pm 11:42 PM

Navicat에서 SQL을 수행하는 단계 : 데이터베이스에 연결하십시오. SQL 편집기 창을 만듭니다. SQL 쿼리 또는 스크립트를 작성하십시오. 실행 버튼을 클릭하여 쿼리 또는 스크립트를 실행하십시오. 결과를 봅니다 (쿼리가 실행 된 경우).

Navicat에서 MySQL에 새로운 연결을 만드는 방법 Apr 09, 2025 am 07:21 AM

응용 프로그램을 열고 새로운 연결 (Ctrl n)을 선택하여 Navicat에서 새로운 MySQL 연결을 만들 수 있습니다. "MySQL"을 연결 유형으로 선택하십시오. 호스트 이름/IP 주소, 포트, 사용자 이름 및 비밀번호를 입력하십시오. (선택 사항) 고급 옵션을 구성합니다. 연결을 저장하고 연결 이름을 입력하십시오.

Navicat은 mysql/mariadb/postgresql 및 기타 데이터베이스에 연결할 수 없습니다 Apr 08, 2025 pm 11:00 PM

Navicat이 데이터베이스 및 해당 솔루션에 연결할 수없는 일반적인 이유 : 1. 서버의 실행 상태를 확인하십시오. 2. 연결 정보를 확인하십시오. 3. 방화벽 설정을 조정하십시오. 4. 원격 액세스 구성; 5. 네트워크 문제 문제 해결; 6. 권한을 확인하십시오. 7. 버전 호환성을 보장합니다. 8. 다른 가능성 문제를 해결하십시오.

MySQL : 쉽게 학습하기위한 간단한 개념 Apr 10, 2025 am 09:29 AM

MySQL은 오픈 소스 관계형 데이터베이스 관리 시스템입니다. 1) 데이터베이스 및 테이블 작성 : CreateAbase 및 CreateTable 명령을 사용하십시오. 2) 기본 작업 : 삽입, 업데이트, 삭제 및 선택. 3) 고급 운영 : 가입, 하위 쿼리 및 거래 처리. 4) 디버깅 기술 : 확인, 데이터 유형 및 권한을 확인하십시오. 5) 최적화 제안 : 인덱스 사용, 선택을 피하고 거래를 사용하십시오.

See all articles

高性能MySql进化论(七):正确的使用索引

1 保持单纯的列

2 正确的采用“前缀索引”的前缀长度

2.1 首先确定整个表索引值的选择率：

2.2 算出几个候选长度的选择率

2.3 选一个最靠近的值，从比较的结果看，应该选7作为前缀的长度

2.4 接下来创建这个前缀索引

3 组合索引中字段的顺序问题

4 聚合索引(Cluster Indexes)

5 覆盖索引（Converting Indexes）

6 索引顺序扫描排序

7 轻便的索引

· 重复的索引

· 冗余的索引

· 未使用的索引

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제