[阿里巴巴集团]一群阿里人如何用 10 年自研洛神云网络平台?技术架构演进全揭秘

[阿里巴巴集团]一群阿里人如何用 10 年自研洛神云网络平台?技术架构演进全揭秘
本文插图
[阿里巴巴集团]一群阿里人如何用 10 年自研洛神云网络平台?技术架构演进全揭秘
本文插图

【编者按】逍遥子曾说 , 对阿里人来说「打仗是最好的团建 , 参加过双 11 的叫战友」 , 同样 , 参加过多次双 11 考验的系统技术都会成为真正意义上的基础设施 , 阿里云飞天系统的云网络平台洛神就是如此 。
本文作者 —— 阿里云智能事业群研究员、网络产品线负责人祝顺民(花名江鹤)就是洛神背后的核心铸造者 。 在「CSDN 在线峰会 —— 阿里云核心技术竞争力」上 , 江鹤为详细分享洛神网络的 10 年演进之路 。
复制链接或点击「阅读原文」可免费观看江鹤分享视频:
https://edu.csdn.net/course/play/28249/388353
作者 | 阿里云研究员祝顺民(江鹤)
编辑 | 唐小引
出品 | CSDN(ID:CSDNnews)
今天的主题是《云网络技术架构的演进之路》 , 主要介绍阿里云网络产品从无到规模应用的 10 年过程中 , 云网络技术平台洛神是怎么发展的 。
[阿里巴巴集团]一群阿里人如何用 10 年自研洛神云网络平台?技术架构演进全揭秘
本文插图

阿里云飞天洛神云网络平台
阿里云系统叫飞天 , 云网络平台称为洛神 , 洛神和飞天系统的关系如下图所示 , 洛神云网络平台是阿里云飞天操作系统内核的核心组件和系统服务 , 伴随着飞天系统一起诞生、成长 。
[阿里巴巴集团]一群阿里人如何用 10 年自研洛神云网络平台?技术架构演进全揭秘
本文插图

图 1 阿里云网络洛神平台与飞天操作系统
整个飞天系统架构分为几个层次 , 底层数据中心基础设施 , 包含物理资源、机房、服务器 , 还有多地域和可用区(AZ)、物理网络等;其上是飞天操作系统的核心 , 支撑了整个云计算的虚拟化 , 包括计算平台神龙 , 存储平台盘古 , 以及网络平台洛神;基于系统核心组件 , 构建了面向用户的系统服务以及原生服务 , 支撑不同行业客户在阿里云上构建自己的应用系统 。
[阿里巴巴集团]一群阿里人如何用 10 年自研洛神云网络平台?技术架构演进全揭秘
本文插图

飞天洛神平台的诞生
洛神伴随飞天系统诞生 , 是云计算产业发展的结果 , 云计算首先是计算虚拟化 , 并提供给不同的用户使用 , 当用户在云上使用计算资源时 , 网络地址独立规划 , 不同用户地址可以相同 , 且虚拟机可以在不同机房之间迁移 , 地址保持不变 , 同时云计算是一个基础设施 , 支持海量用户同时使用 , 这些关键需求要求提供一个超大规模的虚拟化大二层的网络 。
[阿里巴巴集团]一群阿里人如何用 10 年自研洛神云网络平台?技术架构演进全揭秘
本文插图

图 2 云计算租户网络应用需求
这些需求 , 使用传统商用物理交换机和路由器构建的网络 , 无法满足云计算的需求 , 也满足不了阿里云运营这张网络的需求 , 主要原因在于:
1)在百万级别的租户之下 , 如果每个租户都给到一张独立的地址空间 , 地址空间的数量非常庞大 , 传统交换机里面使用 VRF 来隔离租户之间的空间 , 意味着交换机要支持海量的 VRF 资源 , 这是目前硬件能力无法支持的 。
2)服务器和虚拟机的数量增长 , 网络节点以及路由表的规模快速增大 , 虚拟机通讯和迁移要求路由表能快速同步 。
3)当用户对云上网络层面的功能需求越来越多的时候 , 比如说用户在云上不仅希望有个虚拟机 , 还可以有个公网 IP;比如说用户可以自行定义这张网络 IP、路由和安全组 。 另外随着 NFV 技术发展 , 用户希望在云上运行虚拟化业务网元 , 例如负载均衡、NAT 网关、VPN 网络 , 要求对应的底层网络能快速进行功能迭代 , 以满足新需求和新技术的快速应用 。


推荐阅读