旷视科技|旷视十年,AI三级跳

金磊 发自 凹非寺
量子位 报道 | 公众号 QbitAI
旷视科技 , 现在是一家创办10年的公司 。
它是最早在中国打响名气的AI视觉明星 , 是一个全新ID时代的开启者 , 也是同时代独角兽中最快实现规模化营收的公司 。
谈到这一波AI浪潮 , 往往标签就是谷歌和AlphaGo , 而谈到中国AI创业 , 似乎开口就会是旷视和Face++……
但即便如此 , 对于旷视的不同认知也相差甚远 。
有人依然停留在天才云集、清华姚班、AI独角兽的通识印象 。
也有人看到旷视“AI+IoT”的战略选择后 , 认定这可能不再是一家掌握“魔法”的酷公司 。
更少有人能清晰表达旷视一路的“归去来兮” , 理解背后运转的关键逻辑 , 划定关乎本质的边界与核心 。
只是现在 , 10年一梦 , 连点成线 。
宏观透视当前的旷视 , 不断升级打怪和求解的现实挑战 , 可以极简到3个自然数:
1、2 , 3……就是旷视 。
1:一套核心算法
旷视是一家靠算法起家的公司 。
更准确来说 , 可以细分为两类 。
一类是以深度学习(DL)和计算机视觉(CV)为基础的核心算法 。
十年前 , 深度学习露出了快速发展的苗头 , 旷视抓住了这个契机 , 立即决定将DL和CV进行结合;于是乎 , 便形成了现在特征鲜明的算法能力 , 包括面部识别、视频结构化、图像分类、物体检测、语义分割、动作识别等 。
这类算法是旷视之始 , 是旷视算法演进的基础 。
旷视科技|旷视十年,AI三级跳
文章插图

而除了将DL与CV结合之外 , 旷视在它们各自能力上 , 也进行了相应拓展 , 包括更底层的DL模型 , 以及计算摄影、屏下指纹识别、机器人导航CV能力 。
基于核心算法的突破 , 旷视在全球AI顶级竞赛中揽获40个世界冠军 , 创下了前无古人的MS COCO三连冠纪录 , 获誉AI领域的“中国乒乓球队” 。
另一类则是行业算法 (或者叫AIoT算法) 。
【旷视科技|旷视十年,AI三级跳】这类算法的最大特点 , 就是碎片化和个性化 , 这点非常好理解 , 毕竟“千行千面” 。 而旷视的DL+CV , 更多的是解决数据的输入问题 , 但如若要形成行业数据的闭环 , 还需要具备数据挖掘和优化的算法能力 。
旷视认为 , 未来十年算法将无处不在 , 并且成为每个行业“降本增效”最核心的引擎 。 因此 , 在明确“AI+IoT”战略方向后 , 旷视利用自身能力和优势 , 推动了行业算法的创新 , 以实现价值闭环 。
这其中包括在多设备调度优化、数据挖掘和分析等方面 , 实现了多设备之间的高效协同、数据挖掘分析和形成决策 。
例如 , 旷视推出的河图智慧物流操作系统 , 就是通过同构仿真和AI调度优化的能力 , 实现了项目规划、仿真、实施、运营等全流程的数字化和智能化 。
不过 , 在旷视的这个1中 , 算法之强 , 本质还不在于单个模型 , 而是旷视规模化、批量化生产算法的能力 。
即算法生产引擎Brain++ 。
形象化理解 , 如果旷视的算法是蛋 , 那么Brain++就是背后的鸡 。
作为一个生产力工具 , Brain++的形成有旷视业务需求的内因 , 也有当时缺乏可用开源平台的外因 。
但内外因综合之下 , 最终使得Brain++成为了旷视工程实践和算法创新的有力支撑 。
而且相比于TensorFlow等算法框架 , Brain++包含了算法、数据和计算的统一 。
成为了旷视数次在全球AI竞赛中击败谷歌、微软等巨头的“秘密武器” , 是旷视研发不断逢山开路的保障 。
所以归结起来 , 旷视的算法之路 , 经历了从核心算法突破 , 到行业算法落地和创新 , 再到算法生产平台的拓展过程 。
而所谓道生一 , 一生二 , 二生三 , 三生万物 。
在旷视的定义里 , AI是不断演进的算法能力 。 AI是旷视的核心能力 , 其后场景化落地中形成的边界感 , 也始终围绕这个核心 。
算法就是旷视的1 , 有这个1才有后续落地的一切 。
2:有“脑”有“躯干” , 软硬结合的路径
AI浪潮 , 被视为智能化浪潮 , 是一场替代简单重复脑力劳动的革命 。
而这种脑力驱动 , 来自算法 。
但产业化落地 , 光有“脑”不行 , 必须还要有“躯干”合体 。 这个躯干 , 旷视认定是IoT 。
在旷视看来 , IoT是一种网络 , 所具备的特点就是“基于场景空间”、“以人为核心”、“软硬结合” 。 它是旷视AI技术落地的载体 。
而所谓AI+IoT , 就是将AI的能力加进IoT场景中 , 实现从应用、数据中台、边缘设备和终端的全面智能化 。
深度学习驱动的AI复兴 , 本质就是对数据的物尽其用 。
但在现实生产中 , 用数据就得先有可用的数据 , 用石油就得先开采和部署石油管道 。
所以物联网终端执行器、传感器 , 最核心的价值就是数据的在线化 , 部署AI算法后 , 数据就能发挥第一层作用 。
智能手机有了刷脸模组 , 学习了用户面部数据 , 接下来就能展开刷脸解锁的应用 。
但是 , 在物联网的执行器、传感器等组网之后 , 还需要在这些设备与应用之间增加一个智能的“大脑” , 使其具备连接、分析和协同能力 , 这就是旷视着力打造的“AIoT操作系统” 。
此外 , AI落地必须要讲场景 , 明确限定区域 。
而不同场景有不同的IoT设备 , 需要配备不同的AI算法 , 软硬结合的落地方式 , 也就成了题中之义 。
比如城市公共空间、建筑楼宇 , 以及面向工业的物流仓储空间和工厂空间等等 , 场景不同 , 需要的AI软硬件也不同 , 而且交付的对象也千差万别……
只有把算法、软件和硬件的各要素能力 , 集成固化成终端可交付产品 , 才能定价交付 , 才能实现商业化、规模化落地 。
所以旷视被外界所熟知的是战略选择——AI+IoT , 在消费物联网、城市物联网和供应链物联网三大场景展开落地 , 但易于忽略的是 , 这种战略选择 , 其路径决定于软硬结合 , 以及由此带来的客户价值积累 。
实际上 , 软硬结合也是AI业内的大共识 。
特斯拉自研AI算法后进一步自研打造AI硬件 , 依图、地平线等进军芯片也都是基于AI算法和需求的重新定义 。
上一个时代的软硬结合 , 是基于现有硬件 , 打造与之匹配的算法和软件 。
而在IoT时代 , 软件和硬件是天然结合的 , 需要协同设计和联合优化 , 其本身就是软硬一体的 。
3:三大场景的“边界”
边界不是终点 , 边界只是意味着技术到商业是否实现了闭环 , 这是企业阶段性有所为有所不为的选择结果 。
而旷视 , 在算法为核心、AI+IoT的软硬结合为落地方式之下 , 现阶段选择了三大场景 , 也暗合其商业价值增长的短期、中期和长期 。
第一大场景 , 消费物联网 。 最典型如智能手机为主的消费电子上的面部识别、屏下指纹及计算摄影相关的解决方案 。
AI能力应用的终端(手机)已经非常成熟 , 规模化起量也很快 , 毛利率不高但边际效应明显 , 对于AI能力供应商而言 , 被认为是十亿美元市场 。
从2012年开始 , 旷视就开始给OEM手机厂商和App , 提供解决方案 。
除了最知名的刷脸、屏下指纹模组 , 还包括在AI降噪、多摄虚化、夜景超画质以及视频虚化等方面的计算摄影供应 。
旷视科技|旷视十年,AI三级跳
文章插图

除了手机终端的应用之外 , 旷视还在基于Face++人工智能开放平台 , 为互联网金融、网约车、线上租赁平台等企业和开发者 , 提供数十种AI能力及SaaS产品服务 。
第二大场景 , 城市物联网 。
比如面向城市区域内的公共安全、交通管理、城市管理、楼宇园区等场景 , 提供智慧城市解决方案 。 作为城市智能化和新兴基础设施的核心组成 , 这被认为是百亿美元的市场 。
旷视在该领域于2015年入局 , 推出过洞灵慧+边缘盒子、盘古九霄+新型交互设备等AIoT设备 。
旷视科技|旷视十年,AI三级跳
文章插图

而2020年来 , 大众对于城市物联网最具感知的 , 可能莫过于商场、地铁站和机场等公共场景的AI识别和测温了 。
第三大场景 , 供应链物联网 。
集中体现在物流领域 , 相比消费和城市两大场景 , 旷视在这个场景入局最晚——2017年 , 但软硬件一体化能力也展现得最充分 。
有AI算法 , 有软件——操作系统河图 , 还进一步基于AI定义硬件——打造了AMR机器人、SLAM导航智能无人叉车、智能圆盘播种机、人工智能堆垛机……
在供应链物流场景中 , 一方面客户可以是衣食住行用全领域 , 另一方面之前的“大小脑”智能化程度不高 , 可以全方位升级改造 。 这也是该场景被认为有千亿美元潜力的原因 。
旷视科技|旷视十年,AI三级跳
文章插图

目前 , 旷视在供应链物联网领域 , 据称已经累计向鞋服、医药、智能制造、零售电商等不同行业提供了仓库、工厂及零售店的升级改造 , 客户数已近百位 。
所以整体纵览之后 , 旷视在这三大场景的发展 , 有些正处于成熟期 , 有些尚处于发展期 。 三大业务板块市场成熟度、商业前景和规模 , 都有先后之分 。
而万佛朝宗 , 虽然场景领域有不同 , 构建的闭环边界有不同 , 但三大业务板块的AI产业化落地的思路一以贯之:从软件到软硬结合 , 从AI走向AIoT 。
而从AI算法软件平台软硬结合 , 也被旷视认为是AI产业落地的最小路径 。
更是旷视十年摸石头过河探索出的核心经验 。
如何评价?
如今 , 站在现在来总结梳理 , 自然可以把旷视以1、2 , 3来审视 。
不过极简如斯 , 过程却可能并非一蹴而就 , 背后都是旷视从算法到硬件 , 从代码空间到现实场景的10年探索和求解 。
而从旷视出发 , 作为中国AI创业的头雁代表 , 其发展和演进路径 , 也是中国原创AI一派的缩影 , 是前所未有的技术创新到商业模式落地的缩影 。
在AI浪潮之前 , 中国的创业者都是基于硅谷成熟的技术创新之上的商业模式创新 , 于是产生规模化商业价值的时间也就更快 。
但AI浪潮不同 , 算法的创新天然需要与行业和数据结合 , 而行业错综复杂 , 需求高度不确定 , 这造成AI商业价值的落地的周期相对较长 。
旷视用了10年 , 可能就是最具代表性的说明 。
此外 , 软硬件一体的AI时代落地趋势 , 一次次被强化和证明 。
无论是因为自动驾驶能力而自研芯片的特斯拉 , 还是旷视的算法天才们下工厂、走进仓库 , 在物流供应链一线打造机器人……都是这个趋势的明确注脚 。
向重而生、落地为王 , 也在成为AI价值兑现和交付的风向 , 也只有朝着这个方向 , 才能构建从技术到商业的价值闭环 。
如果说 , AI落地是一道摆在所有人面前的时代级应用题 。
那旷视解题的过程和答案 , 就是这份1、2 , 3…数列 。


    推荐阅读