最强国产自动驾驶芯片出炉!两颗就能玩转L3级自动驾驶

最强国产自动驾驶芯片出炉!两颗就能玩转L3级自动驾驶
文章图片
车东西(公众号:chedongxi)文|晓寒
车东西6月15日消息 , 国内自动驾驶芯片公司黑芝麻今天发布了旗下第二款产品——华山二号芯片 。
该芯片是黑芝麻创业四年来的最重磅产品 , 单芯片AI算力最高可达70TOPS(A1000) 。 由两颗华山二号组成的域控制器 , 最高可实现140TOPS的AI算力 , 功耗25W , 可支持L3级自动驾驶 。
最强国产自动驾驶芯片出炉!两颗就能玩转L3级自动驾驶
文章图片
▲黑芝麻华山二号(A1000)芯片
作为对比 , 目前量产车中最强自动驾驶芯片——特斯拉FSD芯片单颗为72TOPS 。 两颗特斯拉FSD芯片构成的域控制器(HW3.0) , 算力为144TOPS , 功耗72W 。
很明显 , 黑芝麻华山二号实现了接近特斯拉FSD芯片的算力 , 但是能耗却只是特斯拉差不多三分之一 , 同时成本也比特斯拉更低 。
从数据上来看 , 华山二号毫无疑问是国内最强自动驾驶芯片 , 性能已逼近特斯拉FSD芯片 , 同时还拥有明显的功耗和成本优势 。
那么问题来了 , 作为一家创业公司 , 黑芝麻的华山二号芯片究竟是如何实现这种炸裂性能的?华山二号芯片的问世 , 又将给风起云涌的自动驾驶市场带来怎样的改变呢?
带着这些疑问 , 车东西也与硅谷芯片老炮——黑芝麻CEO单记章进行了长达两个小时的对话 , 找到了问题的答案 。
一、豪华芯片团队推王牌产品性能叫板特斯拉今天晚上 , 芯片创企黑芝麻举行线上发布会 , 推出了旗下的第二款产品 , 也是创业四年来的最重磅产品——华山二号自动驾驶芯片 , 包括A1000和A1000Lite两个版本 。
其中单颗A1000最高可实现70TOPS的AI算力 , 功耗在8W以内 。 通过不同的组合 , A1000可以支持从L0到L4的多种自动驾驶系统 。
由单颗A1000组成的控制器 , 可以支持L2+级自动驾驶 , 2颗、4颗并联 , 则分别可以实现140TOPS和280TOPS的算力 , 用来支持L3 , 甚至是限定场景的简单的L4级自动驾驶系统 。
最强国产自动驾驶芯片出炉!两颗就能玩转L3级自动驾驶
文章图片
▲基于A1000可组成不同的计算平台
目前量产车中最强的自动驾驶芯片为特斯拉的FSD芯片 , 单颗算力为72TOPS , 略高于A1000 。 两颗FSD芯片组成了特斯拉3.0版的自动驾驶控制器(HW3.0) , 总算力144TOPS , 功耗为72W 。
做个对比 , 两颗黑芝麻A1000组成的L3级自动驾驶控制器算力为140TOPS , 功耗25W , 能效比为5.6TOPS/W 。 特斯拉FSD控制器为2TOPS/W , 英伟达Xavier单芯片则为1TOPS/W(控制器功耗略大 , 能效比更低) 。
这样的数据表现 , 不仅让A1000成了国内目前最强的自动驾驶芯片 , 并且还有实力叫板特斯拉FSD芯片 。
那么到底是怎样一个团队 , 打造出了参数这么优秀的一个自动驾驶芯片呢?
答案是一支芯片老炮+车企老将组成的创业团队 。
最强国产自动驾驶芯片出炉!两颗就能玩转L3级自动驾驶
文章图片
▲左右分别为黑芝麻COO刘卫红、CEO单记章
黑芝麻CEO单记章此前是全球视觉芯片领军企业OmniVision创始团队成员 , 在硅谷芯片行业打拼了20多年 , 在图像处理芯片和软件算法上具有丰富的经验和技术积累 。
CTO齐峥是英特尔奔腾二代芯片主要设计成员、CSO曾代兵是中兴微电子总工程师 , COO刘卫红则曾是博世中国ADAS主力部门——底盘与控制系统事业部的中国区总裁 。
正是这样一支豪华创业团队 , 也让其在成立之初就迅速获得了资本的青睐 。
2017年 , 蔚来、芯动能等资方向其投资了近亿元 。 2019年4月 , 黑芝麻又获得了上汽、SK中国、招商局等机构的B轮投资 。
最强国产自动驾驶芯片出炉!两颗就能玩转L3级自动驾驶
文章图片
▲黑芝麻美国办公室
蔚来和上汽分别是国内最强的新造车和传统车企 , 芯动能背后是国家集成电路产业投资基金和屏幕巨头京东方 , SK则是韩国电信巨头 。
黑芝麻的股东背景同样豪华 , 尤其是蔚来和上汽的入局 , 也让华山二号芯片的量产落地充满了看点 。
二、如何做到高算力?自研AI加速器和ISP是关键自动驾驶系统非常依赖神经网络 , 对芯片的AI算力要求极高 。
各大芯片玩家们则纷纷推出了整合有CPU、GPU、ISP、DSP等多个处理器的SoC芯片来予以对应——黑芝麻的华山二号芯片就是一颗整合了20多个核心的SoC 。
在SoC内部 , 不同芯片企业也选择了不同的技术路径 。
比如英伟达Xavier内部使用了自家极强的GPU来增强AI算力 , 赛灵思的MPSoC内部则整合了自己擅长的FPGA , 特斯拉FSD芯片则靠自研的NPU加速 。
在单记章看来 , GPU加速确实性能很强 , 但问题是GPU相比专用的AI加速器还是太通用了 , 它可以适配各类神经网络是一个优势 , 但问题是功耗大成本高 。
FPGA的优点是硬件可编程 , 可以适配不同算法 。 但是对车企和Tier1的软件工程师来说 , 还需要掌握硬件编程语言 , 用起来太复杂 。
最终 , 黑芝麻选择了跟特斯拉一样的NPU路线 , 在SoC里面集成了一个名为DynamAINN引擎的NPU来进行AI加速 。
这个NPU内部最多可搭载4个3D卷积MAC阵列、1个2DGEMM阵列 , 以及1个EDP运算单元和5个DSP , 支持4/8/16位多种运算精度 , 工作频率为1.2GHz 。
这么多的计算单元 , 既保证了大算力 , 同时又能够适配不同的神经网络 , 并进行压缩和稀疏性加速 , 从而让A1000最高可以实现70TOPS的AI算力 , 以及超过80%的硬件利用率 。
最强国产自动驾驶芯片出炉!两颗就能玩转L3级自动驾驶
文章图片
▲A1000芯片的AI加速引擎
自动驾驶系统对摄像头的依赖极强 , 视频画面又是进行AI计算的基础 。 对于一款自动驾驶芯片来说 , 能够对图像进行优质的前端处理至关重要 。
这方面 , 基于单记章等核心成员在图像处理芯片领域的积累 , 黑芝麻在A1000这颗SoC内还集成了自研的高性能ISP , 以保证让汽车看的更清 。
单记章告诉车东西 , 得益于高性能ISP , A1000可以最多接入12路高清摄像头的画面 , (最高甚至可以达到4K分辨率) 。 再加上高达30Gbps的高带宽 , 让其可以每秒处理12亿像素 。
此外 , A1000还支持HDR处理 , 通过讲长曝光和短曝光的图像进行拟合 , 来让汽车在黑暗、逆光等不利环境下也能看的清楚 。
最强国产自动驾驶芯片出炉!两颗就能玩转L3级自动驾驶
文章图片
▲A1000支持HDR技术
一款自动驾驶芯片想要大规模量产 , 高算力只是第一步 , 适配性、安全性和经济性也是重要指标 。
单记章介绍称 , A1000不仅支持毫米波雷达、超声波雷达、摄像头、IMU、GPS等常见传感器 , 并且还可接入高等级自动驾驶常用的激光雷达、V2X等数据 。
该芯片从研发之初就严格遵循了车规标准 , 满足AEC-Q100G2、ISO26262ASIL-B的要求 。
在A1000内部 , 专门部署了一个安全核心 , 在其他核心失效时来保证基础功能 。 同时在实现L3及以上级别自动驾驶时候 , 多颗A1000芯片互为冗余 , 则可以达到ASILD级认证 。
经济性上 , A1000选择了目前汽车芯片主流的16nm工艺 , 并通过巧妙的设计 , 将SoC封装尺寸降低至90平方毫米 。
作为对比 , 特斯拉采用的是三星14nm工艺 , 尺寸为260平方毫米 。 英特尔家Mobileye的最新产品EyeQ5则采用了7nm工艺 。
较成熟的工艺以及较小的封装面积 , 让A1000拥有了不错的成本优势 。 再加上强大的AI算力、较低的功耗和广泛的传感器适配性 , 让这款芯片真正具备了大规模前装量产的潜力 。
三、自动驾驶产业迎来中国芯将加速L2/L3量产从谷歌2009年成立自动驾驶团队开始计算 , 自动驾驶产业已经走过了10个年头 。
虽然研发进程依然热火朝天 , 但业界目前对L4级以上高等级自动驾驶系统的量产落地则较为悲观——L4级无人车仍然需要安全员随时监督 , 自动驾驶系统仅能在简单环境行驶 , 真正规模化部署遥遥无期 。
不过好消息是L1/L2级自动驾驶已经迎来爆发期——甚至成了新车标配功能 。 而L3级自动驾驶 , 也到了量产前夜 。
博世底盘控制系统中国区驾驶员辅助业务单元副总裁蒋京芳此前表示 , 仅2019年 , 就至少有40款新车搭载了博世的L2级自动驾驶 , 呈现出井喷的态势 。
最强国产自动驾驶芯片出炉!两颗就能玩转L3级自动驾驶
文章图片
▲A1000开发板
到了2020年 , 广汽、长安等自主车企又加速了L3级自动驾驶技术的量产进程 , 先后进行了L3级自动驾驶技术的演示 , 并发布了支持L3级自动驾驶系统的量产车型 。
L1~L3级自动驾驶技术火热的同时 , 却也存在着明显的缺芯现象 。
对于L0/L1级系统 , 使用传统的车规级CPU/MCU即可满足需求 , 但到了L2以及L2+、L3级别 , 就需要引入越来越多的AI算法 , 也意味着需要AI加速器的支持 。
【最强国产自动驾驶芯片出炉!两颗就能玩转L3级自动驾驶】目前使用较多的是FPGA和GPU加速 , 但是都不是最合适的产品 。


    推荐阅读