除了推出大模型,AI发展还应做什么

如果ChatGPT是一阵风,刮到中国后,除了引起各界对AI大模型的关注外,还带来了什么?在日前举行的第六届数字中国建设峰会上,不少官员和学者都在讨论这个问题 。
毋庸置疑,随着ChatGPT的爆火,人工智能又一次站上了风口 。国内不少企业抢抓机遇,纷纷推出自己的AI大模型,比如百度“文心一言”、阿里“通义千问”、华为“盘古大模型”、科大讯飞“星火认知大模型”……据不完全统计,国内迄今已推出了超20个AI大模型 。
面对这么多AI大模型,国家互联网信息办公室副主任曹淑敏有些担忧,“也不能一哄而上” 。
她提到了此前一些地方抢建数据中心的“乱象” 。中国工程院院士、阿里云创始人王坚曾评价:许多地方把数据中心建设成了房地产一样的项目,一些数据中心实际业务就是“出租”,把数据中心的空间分给不同客户……不要为了建设数据中心而去建设 。曹淑敏说,“各个领域不能过热” 。
当前,人工智能日益融入我国经济发展各个领域,成为推动科技跨越发展、产业转型升级、生产力整体跃升的重要驱动力量,为新旧动能转换和经济高质量发展提供了有力支撑 。
中国电子信息产业发展研究院发布的数据显示,2017年至2021年,我国人工智能产业规模增长了2.6倍,占全球比重提升到16.8% 。专利申请量占全球比重持续扩大,从2012年的13%增长到2021年的70.9% 。
曹淑敏表示,虽然取得了很多进步和成就,但我国人工智能整体发展水平和发达国家相比仍存在一些差距,特别是在一些基础理论、原创性的技术还有产业高端的核心技术领域 。
她希望各界能借助ChatGPT带来的东风,真正沉下心去发展人工智能,抓住机遇,“同时要保持定力,能够理性地发展” 。
AI大模型会怎么演进
人工智能发展到现在已经历三次浪潮,基于互联网大数据的深度学习的突破,成就了现在人工智能的盛况 。在中国科学院自动化研究所副所长曾大军看来,ChatGPT系统本身准确地说不是科学上大的突破,而是技术积累到一定程度之后的大集成和使用效果上的大突破,是工程实践的里程碑 。
业内的共识是:超级的算法加上超级的算力再加上超级数据的耦合,终于创造了工程的奇迹 。
中国科学院自动化研究所将ChatGPT的能力、特点概括为“四个通”——通顺自然的自然语言生成、全领域通识知识体系的覆盖、多种自然语言场景的通用和通畅的人机交互、意图识别及逻辑推理 。效果上ChatGPT实现了相当高的乃至类人级别的理解和语言对话能力 。
这背后是AI大模型的支撑,这也是为什么ChatGPT后众多企业扎堆推出AI大模型的原因 。曾大军说,ChatGPT背后大模型的成功为世界认知和建模等人工智能核心挑战探索出了一条与众不同的道路 。
攻克大模型、大算力、大数据等关键核心技术和基础理论,将成为抢抓人工智能发展制高点的关键 。大家想知道的是大模型的路未来会怎么走 。
中国科学院自动化研究所对AI大模型的演进态势做了研判,在第六届数字中国建设峰会·人工智能分论坛上,曾大军介绍了他们的观点:应用和创新生态正在发生剧变或至少有剧变的潜质、大模型推动决策智能迅猛发展、大模型小型化和领域化需求非常迫切、更加通用的人工智能有望实现 。
他说,大模型就像一个人类大脑的雏形,通过喂养各种数据,实现各种智能能力,大模型正在重新定义人和计算机的互动关系,有望成为计算机和人今后主要的接口 。
现场,曾大军着重强调了大模型小型化和领域化的发展 。他说,现有大模型的算力和能耗挑战会促使很多工作向领域专用化、轻量化的小模型或大小模型混搭的方向发展,特别是金融、教育、医疗、交通等领域,大量的工作在试图降低大模型的成本 。
厦门大学南强特聘教授、人工智能研究院负责人纪荣嵘也谈到了这一点 。他说,大模型最终要用到车载、机载、电载等应用上,在无人机等设备中,硬件大一些,成本就以倍数上涨,多一点计算空间就会增加巨额的硬件成本,所以“各个企业也不要只关注模型做大,还要思考怎么样把大模型做小” 。
我国走什么路径
按照国务院2017年发布的《国家新一代人工智能发展规划》,到2025年,人工智能基础理论实现重大突破,部分技术与应用达到世界领先水平,人工智能成为我国产业升级和经济转型的主要动力,智能社会建设取得积极进展 。5年后的2030年,我国人工智能理论、技术与应用总体达到世界领先水平,成为世界主要人工智能创新中心 。


推荐阅读