未来已来!分布式数据库的“星辰大海”绝不仅限于替换

记得两三年前,当人们在谈论起分布式数据库等技术时,还经常在用“未来”等词语描述这一新技术的应用前景 。在刚刚过去的2020年,新一代数据库龙头Snowflake成功上市,成为历史上规模最大的软件企业IPO 。我们回头一看才发现,原来未来已来!
然而,分布式数据库应该如何在企业中正确地落地,一直是业界讨论的焦点 。在国内,大部分读者第一次了解到分布式数据库时,首要的问题就是:分布式数据库是否能替换Oracle?然而,从全球数据量发展的方向来看,其爆发性增长,主要集中在基于数字化创新的多样化业务场景 。因此,单纯替代传统Oracle占据核心优势的固有领域,并非是数据库未来的增长方向 。以Snowflake为例,其业务并没有替换Oracle核心应用领域,却以4亿美元营收换回700亿美元市值,正在撼动Oracle在数据市场的龙头地位,其背后的原因值得我们深思 。

未来已来!分布式数据库的“星辰大海”绝不仅限于替换

文章插图
基于“替换”的思维永远无法“超越”
实际上,在替换Oracle的问题上,并没有“能”或“不能”这样一刀切的答案 。分布式数据库的设计初衷是解决全新的实际业务问题,在Oracle所无法满足的场景中,与企业客户一同迎接数字化转型的机遇,而并不是为了单纯替换某个原有系统 。
传统关系型数据库在核心交易等领域深耕了40多年,到目前为止,大部分纯交易场景不论从数据量还是商业模式都没有本质的变化,其业务的扩展空间也十分有限 。而在企业数字化转型的过程中,数据量会随着业务发展快速膨胀,形成全新的业务需求及数据增量,为数据库带来全新的市场机遇 。
相比传统关系型数据库,分布式数据库在提供ACID事务一致性的能力的同时,拥有更灵活的扩展能力,及多数据模型的处理能力 。在面向海量数据弹性扩展的新兴业务需求时,做到“不使用Oracle而选择分布式数据库”,是我们在行业中应用分布式架构的最佳实践 。也就是说,使用分布式数据库逐步迭代,伴随全新的数字化业务渐渐渗透到传统业务,成为新的数据核心场景,是分布式数据库技术在企业中最佳的落地方案 。
因此,分布式数据库的星辰大海,绝不仅仅在于对传统关系型数据库的简单替换 。如果只是为了使用及推广新技术,而进行固有架构的替换,将会面临极大的技术风险与挑战 。只有站在企业客户的角度出发,与客户共同挖掘数字化转型中的全新数据价值,才能突破固有框架,建立全新的分布式技术赛道,超越传统的架构边界 。
 
如何选择最佳落地场景从业务场景的角度,自上世纪70年代末关系型数据库诞生,Oracle、DB2等数据库已经经历了40多年的发展历史,对于其固有的业务场景来说,基本已经做到了业界极致 。而面向新的数据中台联机湖仓、微服务数据融合管理、海量数据实时访问、非结构化在线处理等方面,传统交易性数据库则明显力不从心 。企业客户选择分布式数据库落地场景时,应该选择适当的应用场景,以真正发挥其优势能力,并持续打磨技术团队的运维能力,逐步推向核心 。
1) 数据中台联机湖仓
在不少的企业IT架构规划中,数据中台已经成为整个IT战略的一部分,包含了历史数据平台甚至非结构化数据处理等多数据模型领域,几乎覆盖了企业中除了业务应用系统之外的全部数据处理及服务能力 。
未来已来!分布式数据库的“星辰大海”绝不仅限于替换

文章插图
在此场景下Oracle无法满足扩展能力,而Hadoop又无法支持实时并发业务 。国际上也没有直接与其对标的技术体系,最为贴近的则是Lakehouse(湖仓一体化) 。Lakehouse的行业主要厂商包括像Snowflake及Databricks等分布式数据库厂商,其产品可以分为数据湖与计算引擎两大核心模块 。2020年Gartner进一步引入了Augmented Transactions Processing处理场景,强调事务一致性,要求数据库在分析处理过程中同时保持低延迟,以提升实时联机处理能力 。
可以预见,支持Augmented Transactions Processing能力的联机湖仓,将为数据中台提升实时联机处理能力,数据实现一次存储多业务多数据模型同时使用,加速数据的处理效率,减少数据冗余,提供更绿色环保的数据基础设施 。
未来已来!分布式数据库的“星辰大海”绝不仅限于替换

文章插图
2) 微服务数据融合管理
微服务应用开发架构逐渐成为主流的今天,传统一个应用对接一个数据库的架构被拆散成几十上百个微服务,每个微服务都可能需要使用独立的数据库实例,因此在企业内部数据库实例数量近年来呈井喷态势发展 。


推荐阅读