传统数据库数小时完成的DDL,TA瞬时就搞定了

X-Engine是阿里巴巴自研的存储引擎,作为阿里云 RDS MySQL 的一个可选引擎,除了主打高性能和低成本,还增加了不少惠及用户的新功能 。本文将详细介绍 MySQL(X-Engine) 如何近乎瞬时完成传统数据库需要数小时完成的DDL操作 。
1.数据库DDL操作面临的问题互联网业务发展迅速,应用模式频繁更改是常态 。相应地,数据库访问模式和schema也随之变化 。DDL(Data Definition Language)是SQL的一类,主要作用是创建和更改数据的schema信息,最常见的操作包括:加减列、更改列类型、加减索引等 。熟悉MySQL的同学都知道,在8.0以前,虽然Online DDL不阻塞其它DML(Insert/Update/Delete)操作,但许多重要的DDL操作,如加列、减列等,仍旧需要等待数小时、甚至好几天时间(依据数据量的大小)才会生效 。更改列类型等操作甚至仍需要锁表执行,阻塞DML操作 。
DDL操作运行时间长,占用系统资源,需要额外的磁盘空间(建立临时表),影响系统吞吐,并且一旦DDL过程中实例crash,恢复时间也会很久 。以加列DDL为例,MySQL经历如下过程:
1.以新schema建立空表 。2.拷贝数据到新表,并且将新加列的值赋为默认值,同时更新索引表 。数据库接受到的DML操作被记录在临时文件 。3.加exclusive lock,阻塞写操作,将临时文件记录的DML操作Apply到新表 。如果DML很多,这一阶段将花费较多时间 。4.删除旧表,将新表命名为旧表的名字 。显然,这个过程加锁时间长,拷贝数据操作会占用系统资源和临时空间,并需要大量I/O 。为了适应变化频繁的业务,不立即更改存储层数据、可以快速完成的DDL(我们称之为Fast DDL)成为了一个必要feature 。MySQL 8.0 增加了instant add column功能,可以在短时间内只修改table元信息,完成加列操作 。遗憾的是,它还不支持其它类型的DDL 。得益于阿里自研的存储引擎X-Engine存储了多版本Table Schema,每一行记录在引擎层就完成了解析,并且可以依据更新版本的schema实现格式转换,X-Engine因此可支持多种类型的Fast DDL 。
2.业界Fast ddl实现方案【传统数据库数小时完成的DDL,TA瞬时就搞定了】MySQL 8.0
record记录了列个数, instant add column操作只修改系统表 。
写操作:新格式的记录 。
读操作:根据存储在系统表中default value补齐新加列 。
支持类型:
• Change index optionRename table• Set/drop default• Modify column when the table is empty• Add/drop virtual columnsAdd columns
MariaDB10.3
整体实现方案与MySQL8.0类似,record记录了列个数,在leftmost leaf page中记录所有列的default值.支持类型:
• Add column• Drop column• Extend VARCHAR maximum (Only if the physical format allows; not VARCHAR(255) to VARCHAR(256))
Aurora
发生ddl后,更新系统表,新、旧版本的schema均要记录下来 。然后广播该修改 。之后接受DML请求,首先转换相关leaf page的所有记录,然后执行DML 。
select请求会将旧版本的记录拼接成新版本记录 。
支持类型
• only supports adding nullable columns, without default values
3.X-Engine多版本schema顾名思义,Fast DDL指数据库能够在极短的时间内完成用户发出的DDL指令并返回 。之所以这么快,是因为只修系统表里的元数据,不变更引擎层存储的数据 。其实现的关键在于:元信息变更之后,内存、磁盘中的物理记录该如何解析 。
Engine的架构采用了LSM-Tree的思想,将新写入的数据以追加方式写入内存memtable,memtable到一定大小后switch为immutable memtable,不再修改 。然后逐渐以固定大小extent的形式,flush到持久化存储中 。当extent到一定数量后,通过合并(Compaction)操作,将相同Key的多个版本合并 。为了让每行记录可解析,最直观简单的方案便是将元信息附着在记录上面 。为了能够不依赖系统表解析记录,X-Engine存储了较为详细的元数据,如果为每一行都附着一份,会占用大量的空间 。为了大大减少存储成本,我们保证每个memtable和extent内部的数据schema一致,并将schema信息存储在memtable和extent之上 。
传统数据库数小时完成的DDL,TA瞬时就搞定了

文章插图
 
schema信息包含了诸如列个数、列类型、列长度、默认值等关键信息 。利用这些信息,X-Engine可以在返回结果之前,完成列解析,并只需返回查询目标列的对应结果 。下面给出了一个具体的例子,同一张表存在不同schema版本的extent时,如何返回结果 。
传统数据库数小时完成的DDL,TA瞬时就搞定了


推荐阅读