一、索引
在之前,我对索引有以下的认知:
- 索引可以加快数据库的检索速度;
- 表经常进行INSERT/UPDATE/DELETE操作就不要建立索引了,换言之:索引会降低插入、删除、修改等维护任务的速度;
- 索引需要占物理和数据空间;
- 了解过索引的最左匹配原则;
- 知道索引的分类:聚集索引和非聚集索引;
- MySQL支持Hash索引和B+树索引两种;
- 使用索引为什么可以加快数据库的检索速度啊?
- 为什么说索引会降低插入、删除、修改等维护任务的速度;
- 索引的最左匹配原则指的是什么?
- Hash索引和B+树索引有什么区别?主流的使用哪一个比较多?InnoDB存储都支持吗?
- 聚集索引和非聚集索引有什么区别?
- ........
首先Mysql的基本存储结构是页(记录都存在页里边):
文章插图
文章插图
- 各个数据页可以组成一个双向链表;
- 而每个数据页中的记录又可以组成一个单向链表;
- 每个数据页都会为存储在它里边儿的记录生成一个页目录,在通过主键查找某条记录的时候可以在页目录中使用二分法快速定位到对应的槽,然后再遍历该槽对应分组中的记录即可快速找到指定的记录;
- 以其他列(非主键)作为搜索条件:只能从最小记录开始依次遍历单链表中的每条记录 。
- 定位到记录所在的页
- 需要遍历双向链表,找到所在的页
- 从所在的页内中查找相应的记录
- 由于不是根据主键查询,只能遍历所在页的单链表了
2、索引提高检索速度
索引做了些什么可以让我们查询加快速度呢?
其实就是将无序的数据变成有序(相对):
文章插图
要找到id为8的记录简要步骤:
文章插图
很明显的是:没有用索引我们是需要遍历双向链表来定位对应的页,现在通过"目录"就可以很快地定位到对应的页上了!
其实底层结构就是B+树,B+树作为树的一种实现,能够让我们很快地查找出对应的记录 。
3、索引降低增删改的速度
文章插图
如果一棵普通的树在极端的情况下,是能退化成链表的(树的优点就不复存在了)
文章插图
B+树是平衡树的一种,是不会退化成链表的,树的高度都是相对比较低的(基本符合矮矮胖胖(均衡)的结构)【这样一来我们检索的时间复杂度就是O(logn)】!从上一节的图我们也可以看见,建立索引实际上就是建立一颗B+树 。
- B+树是一颗平衡树,如果我们对这颗树增删改的话,那肯定会破坏它的原有结构;
- 要维持平衡树,就必须做额外的工作 。正因为这些额外的工作开销,导致索引会降低增删改的速度;
除了B+树之外,还有一种常见的是哈希索引 。
哈希索引就是采用一定的哈希算法,把键值换算成新的哈希值,检索时不需要类似B+树那样从根节点到叶子节点逐级查找,只需一次哈希算法即可立刻定位到相应的位置,速度非常快 。
- 本质上就是把键值换算成新的哈希值,根据这个哈希值来定位 。
文章插图
【数据库两大必备神器:索引和锁底层原理是什么】看起来哈希索引很牛逼啊,但其实哈希索引有好几个局限(根据他本质的原理可得):
- 哈希索引也没办法利用索引完成排序;
- 不支持最左匹配原则;
- 在有大量重复键值情况下,哈希索引的效率也是极低的---->哈希碰撞问题;
- 不支持范围查询;
推荐阅读
- 数据库缓存更新的套路
- html5怎么连接数据库?
- 数据库并发2万就跪了?你需要这份指导性的知识框架
- 优化必备 redis异步访问模式--管道技术
- 北京大医院看病有窍门,真的!挂号一定要认准“两大四小”
- 从拍照到视频,这9款摄影后期APP“装机必备”
- 超全的出境必备APP清单,就算不会英语毫无方向感,也能走遍全球
- Python 连接数据库的多种方法
- 4个MySQL优化工具AWR,帮你准确定位数据库瓶颈!
- mysql怎么导出数据库?