一文读懂MySQL中的索引-百分百源码网

一文读懂MySQL中的索引

发布时间：09/01 来源：未知浏览：关键词：

什么是索引

索引是一种数据构造，其作用就是用来提高数据查询效力。比力常用的比方就是将其类比为书籍的名目。通过名目可以准确的寻到某一章节的内容所在页。

在数据量较小的时候使用索引其实也没有什么意义，即便没有索引需要一条一条遍历数据关于运算机来说也并不需要太多时间。而一旦数据量较大，要包管我们能正常的对外供给效劳，包管会员使用体验那么索引就是必要的了。

索引类型

索引是一种数据构造，为了应对不一样的场景会有多种实现。在MySQL中主要就是Hash索引和B+Tree。

Hash索引

hash信赖大家应当都很熟知，hash是一种key-value情势的数据构造。实现一样是数组+链表的构造，通过hash函数运算出key在数组中的位置，然后假如显现hash冲突就通过链表来解决(拉链法)。当然还有其他的解决hash冲突的办法。hash这种数据构造是很常用的，比方我们系统使用HashMap来构建热点数据缓存，存取效力很好。

hash构造存数据第一通过运算key的hash值来肯定其在数组中的位置，假如有冲突就在该数组位置建一个链表。这样很明显有几个问题：

即便是具有雷同特点的key运算出来的位置大概相隔很远，持续查询效力低下。即不支撑范畴查询。

hash索引储备的事运算得到的hash值和行指针，而不储备详细的行值，所以通过hash索引查询数据需要停止两次查询(第一查询行的位置，然后寻到详细的数据)

hash索引查询数据的前提就是运算hash值，也就是要求key为一个能准确指向一条数据的key，所以关于like等一类的匹配查询是不支撑的。

所以我们可以知道的是hash索引适用于快速拔取某一行的数据。

B+Tree构造

从名字上看这明显是一种树构造，在大学期间数据构造的课本上树构造是必讲的。树构造是一种特殊重要的数据构造，在许多地方都会使用到。

上面我们说到hash索引没法停止范畴查询，在树构造中也有一种利便停止有序查询的构造--二叉搜索树。二叉搜索树的构造中要求父节点的值大于左孩子节点并且小于右孩子节点，如下图：

1564735832(1).png

上图中二叉树的查询的时间复杂度为O(log(n))，当然要包管O(log(n))的时间复杂度就需要包管二叉树时刻保持均衡。

而在MySQL索引中虽然也使用了树构造，但是并不是使用的二叉树。由于在数据库中数据终究都是存置在磁盘上的，而假如树的节点过多的话，那么在节点之间转移会花费较多的时间。在MySQL的实现中选中将更多内容放在统一个节点，对统一个节点的操纵转入在内存中完成，减少在外存中节点之间转移的次数，以到达提高效力的目的。这就是B+Tree，在B+Tree的实现中一个三层的树构造就根本上可以知足我们几乎所有的需求了。

相关引荐：《mysql数据库知识学习》

B-Tree

要理解B+Tree第一就得理解B-Tree，B-Tree是一种均衡树，这里的B指的是Balance而不是Binary，更确切的说B-Tree是一种多路均衡搜索树。

多路均衡搜索树如下图：

1564735844(1).png

这是一种2-3树，意思就是每个节点存有两个值，同时每个节点分支数为3，从上图中可以看出来着中构造很适合查询数据。每个节点的左子树的值都是小于当前节点中最小的值，中心的子树的值全都是在当前节点两个值的中心，而右子树的值全都大于当前节点的最大值。

比方我们要查寻24这个值：

（1）第一从根节点推断24在根节点(15,25)之间，所以摆布子树排除，从中心查寻。

（2）然后寻到中心子树的根节点(18,22)，比力发明24大于该节点最大值，排除左子树和中心子树。

（3）寻到右子树，推断节点大值恰好等于24，查询完毕。

基于上面的流程可以总结B树的搜索：

（1）从根结点开端，对结点内的关键字（有序）序列停止二分查寻。

（2）假如命中则完毕，不然进入查询关键字所属范畴的子结点；

（3）反复上面的流程，直到所对应的子节点为空，或已经是叶子结点；

可以看出其搜干脆能相当于在关键字汇合内做一次二分查寻。从这里看来仿佛B-Tree没有什么问题，但是需要留意到的是在B-Tree中每一个节点都是储备索引关键字乃至其代表的详细行数据。而在MySQL中数据库加载数据是以页为单位加载，每一页的大小是牢固的(默许16k)。假如每一个节点都储备所有的值，那么一页中能存下的节点就会很少，一次查询大概就会停止屡次从内存中去加载数据，致使机能落低。

B+Tree

B+Tree是对B-Tree的一个变种，让其愈加顺应于停止外部储备文件索引。

两者此前最大的不一样就在于B-Tree的每个节点都储备所有的数据，而B+Tree需要储备的数据都在叶子节点上，并且增添了次序拜访指针，每个叶子节点都有指向下一个相邻的叶子节点的地址。这样的构造包管了在一个内存页中可以存下更多的索引节点，并且愈加适合停止范畴查询。

索引

由于储备引擎负责实现索引，所以接下来计议索引都是基于MySQL的InnoDB引擎。

聚簇索引

聚簇的意思是表示数据行和相邻的键值聚簇的储备在一起。一些数据库同意选中详细的某一个索引作为聚簇索引，而在InnoDB的实现中直接将主键索引指定为聚簇索引。假如没有定义主键，InnoDB 会选中一个独一的非空索引来代替主键索引。假如一样没有定义这样的索引，InnoDB会隐式定义一个主键来作为聚簇索引(row_id)。

聚簇索引实例如图：

1564735920(1).png