|谈起国内AI开源开放生态,为何这些大咖都在讨论飞桨


机器之心报道
作者:张倩
AI 技术需要开源、开放 , 对于这一点 , 产学研各界已经达成了共识 , 政府也在全力支持国内开源生态的建设 。
长期以来 , 开源开放的研究氛围一直是促进人工智能领域发展的关键因素 。 正是因为学界和业界参与者不断和快速地公开自己的研究结果和代码 , 人们才能够及时掌握相关方向的最新进展 , 并在学术环境之外开展自己的研究 。
在百度与中国科协学会学术部共同主办的 2020 中关村论坛——AI 开源创新与产业智能化平行论坛上 , 开源、开放再次成为了中心话题 。 在这次论坛中 , 中国工程院院士、浪潮首席科学家王恩东 , 百度首席技术官、深度学习技术及应用国家工程实验室主任王海峰 , 百度集团副总裁、深度学习技术及应用国家工程实验室副主任吴甜 , 小米集团副总裁、小米集团技术委员会主席崔宝秋 , 天津飞腾信息技术有限公司副总经理张志群等十余位产学研各界顶级专家带来了AI 开源生态构建、产业智能发展趋势以及自主核心 AI 技术应用价值成果的深度分享 。
在谈到开源创新为何如此重要时 , 王海峰表示 , 人工智能高速发展 , 已成为新一轮科技革命和产业变革的重要驱动力量 。 这其中 , 人工智能技术的开源创新起到了很大的作用 。 一方面 , 开源创新可以加速技术的创新发展 , 不断拓展人类认知边界和技术边界;另一方面 , 所有开发者都可以基于开源开放的成果开发自己的项目、产品及业务 , 更便捷、高效、安全地推进技术创新与应用 。
|谈起国内AI开源开放生态,为何这些大咖都在讨论飞桨
本文插图

百度首席技术官、深度学习技术及应用国家工程实验室主任王海峰在论坛中致辞 。
2012 年 , AlexNet 的成功吸引了学术界和工业界对于深度学习的广泛关注 。 如今 , 深度学习已经成为 AI 研究的主流方法 。 在这场产业智能化升级之战中 , 深度学习自然也成了「商家必争之技」 。 然而 , 深度学习应用的高门槛也让很多企业望而却步 , 很多工作都是在「重复造轮子」 , 创新无从谈起 。
作为「智能时代的操作系统」 , 开源深度学习平台的出现彻底改变了这一现状 。
开源开放的深度学习平台有效地降低了深度学习技术应用门槛 。 作为百度自主研发、国内最早开源开放、功能完备的产业级深度学习平台 , 飞桨一直备受瞩目 , 而且已经大规模应用于通信、电力、城市管理、工业、农业、林业等众多关乎国计民生的领域 , 加速推动千行万业实现智能化 。
在这次论坛中 , 吴甜做了主题为「飞桨推动产业智能化之路」的演讲 , 系统介绍了开源开放的飞桨在产业智能化升级大潮中所扮演的重要角色 。
|谈起国内AI开源开放生态,为何这些大咖都在讨论飞桨
本文插图

百度集团副总裁、深度学习技术及应用国家工程实验室副主任吴甜在论坛中演讲 。
长期致力于小米技术研究与应用的崔宝秋也在本次论坛上分享了他的观点《智能新时代 拥抱开源》 。 他指出 , 云计算与大数据时代离不开开源 , AI时代更是与开源相互促进 。
【|谈起国内AI开源开放生态,为何这些大咖都在讨论飞桨】|谈起国内AI开源开放生态,为何这些大咖都在讨论飞桨
本文插图

小米集团技术委员会主席崔宝秋在论坛中演讲 。
飞腾公司副总经理张志群发表了题为《飞腾芯算力 智能新引擎》的演讲 。 他表示 , 新基建带来了万亿级市场 , 也为产业智能化升级带来许多机会 , 更给信息产业提出了算力、协同、安全、应用这四大考验 。 其中 , 自主可信、内生安全 , 是新基建的运行保障;开放联合、应用创新 , 是新基建的落地关键 。
|谈起国内AI开源开放生态,为何这些大咖都在讨论飞桨
本文插图

天津飞腾信息技术有限公司副总经理张志群在论坛中演讲 。
国内首个开源开放的产业级深度学习平台——百度飞桨
飞桨是百度自主研发 , 国内首个开源开放、技术领先、功能完备的产业级深度学习平台 , 2016 年正式开源 。
在深度学习模型开发、训练、预测和部署等方面 , 飞桨已可比肩 TensorFlow、PyTorch 等国际主流框架 , 并在多项技术上有优于后者的表现 , 打破了国内的 AI 开发者过度依赖国外开源深度学习框架的局限 , 有助于进一步培育自主可控的 AI 产业生态 。
在论坛中 , 吴甜介绍说 , 飞桨目前有四个方面的领先技术:开发便捷的产业级核心框架、支持超大规模深度学习模型训练、多端多平台部署的高性能推理引擎以及覆盖多领域的工业级模型库 。
最近 , 飞桨又迎来全新升级 。 从技术层面出发 , 此次更新可形容为「动静统一、软硬融合」 。 在硬件上 , 飞桨目前已适配 22 种芯片型号 , 覆盖 15 家硬件厂商 , 对国产硬件的支持超过 TensorFlow 和 PyTorch;软件上 , 动态图功能升级实现了动静态的结合 , 让用户更容易开发模型;全面升级的 API 体系 , 则对于开发者更加友好 。 目前 , 飞桨可以与华为等硬件进行深度配合 , 让 AI 应用收获更强劲的效果 , 加速人工智能技术的进一步普及 。
如今 , 飞桨已经应用到金融、工业、城市治理等多个领域 。
在金融风控领域 , 使用飞桨可以将信贷风险判断准确率提升 21% , 飞桨中的语义理解模型 ERNIE 通过学习大量的文本和知识实现了语义理解性能的大幅提升 。
在计算机视觉领域 , 飞桨已经开始助力工业质检 , 比如笔记本外壳检测、总装车灯检测 , 帮助工厂在大面积的产品或小部件中找出微小的瑕疵 。
在智慧城市中 , 飞桨可以应用于城市治理、施工车辆追踪 , 车辆违章监测等场景 。
飞桨的成功秘诀:开源
和 AI 领域的其他技术一样 , 飞桨的成功 , 自然也离不开开源 。
作为开源软件 , 飞桨一直在建设开源社区 。 目前 , 飞桨已经凝聚了 230 万开发者 , 创造了 31 万个模型 , 项目数量总体超过 4.7 万 , 并且有多个项目登顶各大榜单 。 飞桨推出的飞桨开发者 PPDE 计划也共建了开源社区 , 组建了 22 个飞桨地方社群 , 100 多个高校社群 。
开源给飞桨的开发所带来的益处良多 。
首先 , 开源的环境对平台的开发提出了更高的要求 。 开源以后 , 社区里的开发者非常多 , 工程师把代码亮出来以后 , 大家都能知道你是如何设计的 , 以及你的代码、文档有没有问题 。 这就对整个编程的易用性、API 的完备性提出了新的要求 , 这些要求以前在不做开源时不会考虑太多 。
其次 , 开源是帮助构建生态的良好方式 。 深度学习框架的上下游生态非常复杂 , 需要和芯片、计算机系统做对接 。 在飞桨开源的生态系统中 , 第三方生态贡献扮演了很重要的角色 。 在飞桨这个项目中 , 很多的开发不是百度工程师做的 , 还有其他人在基于这个做出新的项目和更多的贡献 。
在论坛中 , 王海峰表示 , 百度十年以前开始全面布局人工智能的时候 , 就是本着开源、开放的精神 。 早在 2012 年 , 百度就开放了翻译的 API 。 如今 , 百度翻译每天的翻译量已经达到了 1000 亿字符 。 2013 年 , 百度又开放了语音平台 , 现在每天的调用量超过 150 亿 。
2016 年 , 在开源飞桨的同时 , 百度也开放了百度大脑的很多 AI 能力 。 发展到今天 , 百度大脑每天的调用量超过 1 万亿 , 很多开发者都在使用这些工具推动自己的业务 。
与此同时 , 企业对于开源的拥抱程度也是在持续增加的 。
一方面 , 企业自身所开发的软件平台、工具正在进行越来越多的开源工作 , 有 95% 的受访者认为企业开源是至关重要的 。 另一方面 , 企业在使用开源软件的时候 , 预期也在一直在发生变化 , 77% 的受访者表示他们希望增加对企业开源软件的使用 。 这些都说明 , 开源社区是在持续发展的 , 这反过来又会促进飞桨等开源平台的发展 。
核心问题:如何建好生态?
在主题演讲之后 , 百度深度学习技术平台部高级总监马艳军主持了一场围绕「AI 开源创新赋能产业发展」话题的高峰对话 。 工商银行大数据人工智能实验室副总经理黄炳、中国联通研究院人工智能总监廖军、中车研究院智能产品负责人田寅、Gartner(高德纳)研究咨询高级总监张桐、百度 AI 技术生态部总经理刘倩等嘉宾展开深度的行业交流 。
田寅表示 , 开源工具在传统企业发挥着非常重要的作用 , 它们可以帮大家更快地上手深度学习 , 更快地领悟到新技术 。 廖军认为 , 这种好处其实是双向的 , 在开源工具赋能传统行业的同时 , 后者其实也充当着贡献者 , 在用的过程中发现问题 , 帮助开发者打磨这些工具 , 双方一起建设一个完善的生态 。
在整个论坛中 , 「生态」都是一个高频词 , 开源本身就是要建立一个生态体系 。 那么 , 如何建好这个生态体系 , 找到利益互通的点 , 避免恶性的竞争是一个值得思考的问题 。
张桐认为 , 在数据方面 , 我们需要用联邦学习等技术解决数据孤岛问题 , 让数据真正为我所用;在算力方面 , 要建立一种共享机制 , 帮助中小企业用上 AI 。
对于数据孤岛问题 , 黄炳补充说 , 其实行业里面关于联邦学习的产品不是没有 , 而是过多 。 因此眼下的问题其实是联邦学习缺乏规范性 。 他认为 , 要让中小企业用上 AI , 核心其实是搭建平台 , 把中小企业接触 AI 的门槛降下来 。
众嘉宾表示 , 目前业界开源生态与环境正在随着 AI 大规模落地的进展快速构建 。 在业务实践中 , 类似飞桨这样成熟可靠 , 已被大量产业级应用验证的开源平台 , 不仅为技术开发和企业创新不断降低着门槛 , 更为整个产业智能化升级不断加速 。
|谈起国内AI开源开放生态,为何这些大咖都在讨论飞桨
本文插图

「AI 开源创新赋能产业发展」 高峰对话 。
对于百度做开源的核心思路 , 百度 AI 技术生态部总经理刘倩解释说:「做开源开放的时候 , 我们有一个非常明确的判断 , 就是人工智能最后的产业级应用一定不是由某一家企业来主导完成的 , 最后一定会形成一个角色分明、上下游的这样一个产业级的生态 。 所以从那个时候开始 , 我们去分享开源平台 , 去做百度大脑开放平台 , 其实都是在做最底层的基础设施 , 希望能够给各行各业提供从数据、算法、工具到平台的支持 。 」
在对话现场 , Gartner 还发布了最新调研报告《飞桨推动中国产业智能化之路》 , 从深度学习趋势判断方面着重分享了飞桨在推动中国产业智能之路中形成的自我定位、技术优势、技术布局以及生态布局等 。


    推荐阅读