索引是一种用于快速查询行的数据结构,就像一本书的目录就是一个索引,如果想在一本书中找到某个主题,一般会先找到对应页码 。在MySQL中,存储引擎用类似的方法使用索引,先在索引中找到对应值,然后根据匹配的索引记录找到对应的行 。
我们首先了解一下索引的几种类型和索引的结构 。
索引类型B树
大多数存储引擎都支持B树索引 。b树通常意味着所有的值都是按顺序存储的,并且每一个叶子也到根的距离相同 。B树索引能够加快访问数据的速度,因为存储引擎不再需要进行全表扫描来获取数据 。下图就是一颗简单的B数 。
文章插图
B树的查询流程:
如上图我要从找到E字母,查找流程如下:
- 获取根节点的关键字进行比较,当前根节点关键字为M,E<M(26个字母顺序),所以往找到指向左边的子节点(二分法规则,左小右大,左边放小于当前节点值的子节点、右边放大于当前节点值的子节点);
- 拿到关键字D和G,D<E<G 所以直接找到D和G中间的节点;
- 拿到E和F,因为E=E 所以直接返回关键字和指针信息(如果树结构里面没有包含所要查找的节点则返回null);
- 通过指针信息取出这条记录的所有信息;
下图为B+树的结构,B+树是B树的升级版,我们可以观察一下,B树和B+树的区别是什么?
文章插图
B+树和B树的区别是:
- B树的节点中没有重复元素,B+树有 。
- B树的中间节点会存储数据指针信息,而B+树只有叶子节点才存储 。
- B+树的每个叶子节点有一个指针指向下一个节点,把所有的叶子节点串在了一起 。
文章插图
我们假设被索引的列是主键,现在查找主键为5的记录,模拟一下查找的过程:
B树,在倒数第二层的节点中找到5后,可以立刻拿到指针获取行数据,查找停止 。
B+树,在倒数第二层的节点中找到5后,由于中间节点不存有指针信息,则继续往下查找,在叶子节点中找到5,拿到指针获取行数据,查找停止 。
B+树每个父节点的元素都会出现在子节点中,是子节点的最大(或最小)元素 。叶子节点存储了被索引列的所有的数据 。
那B+树比起B树有什么优点呢?
- 由于中间节点不存指针,同样大小的磁盘页可以容纳更多的节点元素,树的高度就小 。(数据量相同的情况下,B+树比B树更加“矮胖”),查找起来就更快 。
- B+树每次查找都必须到叶子节点才能获取数据,而B树不一定,B树可以在非叶子节点上获取数据 。因此B+树查找的时间更稳定 。
- B+树的每一个叶子节点都有指向下一个叶子节点的指针,方便范围查询和全表查询:只需要从第一个叶子节点开始顺着指针一直扫描下去即可,而B树则要对树做中序遍历 。
create table Student( last_name varchar(50) not null,first_name varchar(50) not null,birthday date not null,gender int(2) not null,key(last_name, first_name, birthday));对于表中的每一行数据,索引中包含了name,birthday列的值 。下图显示了该索引的结构:
文章插图
索引对多个值进行排序的依据是create table语句中定义索引时列的顺序,即如果名字相同,则根据生日来排序 。
B+树的结构决定了这种索引对以下类型的查询有效:
- 全值匹配 和索引中所有的列进行匹配,例如查找姓名为Cuba Allen,生日为1960-01-01的人 。
- 匹配最左前缀 查找姓为Allen的人,即只用索引的第一列 。
- 匹配列前缀 匹配某一列的值的开头部分,例如查找所有以J开头的姓的人 。
- 匹配范围值 查找姓在Allen和Barrymore之间的人 。
- 精确匹配某一列并范围匹配另外一列 查找姓为Allen,名字是字母K开头的人 。即第一列last_name全匹配,第二列first_name范围匹配 。
- 只访问索引的查询 查询只需要访问索引,无需访问数据行 。这种索引叫做覆盖索引 。
- 古丈毛尖的功效与作用古丈毛尖是什么茶
- 超详细的mysql数据库主备切换演练教程,值得收藏
- 碧螺春茶的功效与禁忌
- 立顿绿茶的功效与作用
- 防止网站被iframe内框架调用的方法
- WEB验证的过去现在与未来
- 聊聊java中的进制问题
- mysql导入数据
- 烤箱做蛋糕回缩的原因 烤箱做蛋糕会回缩是怎么回事
- 微信公众号的推广渠道和方法