从算力、数据、算法、工程化等维度看AI的未来( 三 )


(4)模型自评估
现有的AI算法,无论是机器学习算法,还是深度学习算法,其研发模式本质上是通过训练闭环(closed loop)、推理开环(open loop)的方式进行的 。是否可以通过设计模型自评估,在推理环节将开环系统进化成闭环系统也是一个值得研究的领域 。在通信领域,控制领域等其他行业领域的大量算法实践表明,采用闭环算法的系统在性能和输出可预测性上,通常均比开环系统优秀,且闭环系统可大幅降低性能断崖式衰减的可能性 。闭环系统的这些特性,提供了对AI系统提高鲁棒性和可对抗性的一种思路和方法 。

工程化
上文已经对人工智能数据、算力、算法层面进行了梳理和分析,最后我们看看工程化 。工程化对于人工智能,如同厨具对于美味佳肴一样,是将数据、算力、算法结合到一起的媒介 。
工程化的本质作用是提升效率,即最大化利用资源,最小化减少信息之间的转换损失 。打一个简单的比喻,要做出美味佳肴,食材、厨房灶台、厨师都有,但是唯独没有合适的厨具,那么厨师既无法发挥厨艺(算法),又无法处理食材(数据),也无法使用厨房灶台的水电气(算力) 。因此,可以预见,工程化未来的发展,是将上文提到的算力与算法性能关系,从现在的9次方,逼近到理论上限4次方的重要手段之一 。
过去10年,AI工程化发展,已形成一个明晰的工具链体系,近期也伴随着一些值得关注的变化,笔者将一些较为明显的趋势,汇总如下:

从算力、数据、算法、工程化等维度看AI的未来

文章插图
总结来说,AI工程化正在形成从用户端到云端的,以Python为编程语言的一整套工具链,其3个重要的特点为:远程编程与调试,深度学习与机器学习的GPU加速支持,以及模型训练与推理工具链的解耦 。与此同时,产业链上游厂商对开源社区的大量投入,将为中下游企业和个人带来工具链的技术红利,降低其研发门槛和成本,笔者认为微软、脸书、英伟达3家上游厂商主推的开源工具链尤其值得关注 。

结语
对于人工智能技术过去10年发展取得的成就,有人归因于数据,也有人归因于算力 。未来人工智能技术发展,笔者大胆预测,算法将是核心驱动力 。同时,算法研发的实际效率,除了算法结构本身,还取决于设计者对先进工具链的掌握程度 。
未来10年,科技界是否能用更少的数据,更经济的算力,获得真正意义上的通用智能呢?我们拭目以待 。




推荐阅读