探索|AI:我又又又打败了人类冠军!小学生:叫爸爸!( 二 )
将儿童探索行为应用于AI , 一切都能变得更好 , 理想层面上确实如此 , 但现实总喜欢跟科学家们开玩笑 , 也算是给人类保留了一个“杀手锏”吧 。
AI能力暴涨的当下 ,
人类为什么还能稳坐智慧王座?
需要注意的是 , 这些类似儿童探索的策略 , 通常更多被用在训练期间提高代理人的经验值 , 而不是在决策时支持快速学习和探索 。 用人话说就是“懂得了许多道理 , 却不一定能过好这一生” , 因为一到关键选择时刻就会掉链子 。
就拿前面提到的深度优先搜索(DFS)来说 , 科学家们发现 , 如果让孩子们自由探索 , 那么他们与智能体按DFS做出的行动有90%的相似 , 而以目标为导向(找到橡皮糖)来探索的话 , 有96%的路线都是相似的 。 但不同的是 , 探索越多的孩子 , 最后能花费更少的时间完成任务 , 智能体却相反 。
图片
如果智能体发现一个地方很有趣(能得到奖励) , 就会一直重新访问该区域 , 直到它终于终于终于觉得那里不再有趣了 , 这会导致其概括性不佳(无法形成最佳策略) 。
其中的差别就在于 , 孩子不是被动地孤立学习或由目标驱动 , 而是在不断实验和收集信息 , 将自己的认知和经验与获得的信息结合起来 , 编织出一个丰富的世界模型 。 而即使最复杂的机器探索方法 , 也只能为特定的目标服务 , 一时半会还无法完美匹配这个充满了各种“意外”的真实世界 。
为什么有了一定的探索能力 , AI智能体的表现还是不尽如人意呢?
首当其冲就是实验室与现实环境的巨大不同 。
深度强化学习过去都是“机上谈兵” , 不是跟人类在二维游戏里PK , 就是数字网格里下棋 , 而儿童的探索则是发生在信息丰富的三维现实世界之中 , 许多潜在因素很难被应用到实验中 。
这也是为什么 , 当今最强大的AI智能机器人也达不到一个仅小学毕业的优秀人类服务员的工作能力 , 能像他们一样快速适应环境、完成各种复杂任务 。
图片
此外 , 儿童的发展心理学研究很难在AI产业链中形成“闭环” 。 要真正激发AI生长出服务现实的能力 , 不仅要构建出具有更强探索能力的智能体 , 还要继续学习人类的认知能力 , 推进人工智能自身的理论创新和软硬件升级(比如搭建三维训练环境) , 这一系列链式突破 , 才能最终将技术构想转化为现实生产力 。 “大力出奇迹”的深度学习 , 其高光时刻就是这么来的 。
沿着这个方向 , 我们可以进一步了解 , 怎样才能弥合智能体与人类之间的差距 。
下一代AI , 逐渐浮出迷雾的真实未来
在过去的数年里 , 深度学习做到了传统算法所无法企及的进度 , 催生了大量的工业界应用 , 但其实 , 现在的深度学习还是很傻——举个例子 , 大部分人都可以通过几十个小时的学习学会开小汽车 , 而完全自动的L5级无人汽车至今还是个遥远的梦 。
图灵奖得主Geoffrey Hinton就一直非常渴望找到一种新的实现深度网络的方法 , 认为目前(最广泛的反向传播算法)根本不是大脑的工作机制 。
另一位图灵奖得主Yann Lecun , 就认为在某些游戏中 , 需要大量增加模型训练时间才能达到或超过专业人类玩家的水平 。
通过儿童的学习模式 , 发现当前最优秀的AI也比不上5岁小孩的智力 , 或许我们可以回答“下一代AI应该是什么样” , 这个神经网络最重要的未解难题之一 。
至少要有两重升级:
1.有意识 。 目前公认文字表达能力最高、模型最为庞大的GPT-3也曾被专家吐槽是“无脑作业” , 其实并不真正理解自己写出的句子 。 而具有自主探索、决策、推理能力的AI , 可以理解自己周围的环境 , 才是真正的人工智能 。
推荐阅读
- 行业互联网|2020走进华为西安研究所成功举办,探索“5G+云+AI”
- PChome电脑之家|OPPO清华携手打造研究中心 探索智能技术发展
- 科学探索|925丨科学家发现24颗比地球更宜居星球
- 科学|太空中有个“宝葫芦”,是人类探索的最远天体,它的形成非常独特
- |桂卫华院士:探索有色产业绿色发展之路
- 科学|黑洞探索者:霍金缺席的诺贝尔物理奖毫不失色
- 月球|月球的起源之谜,人类对月球的不懈探索
- 奶粉|圣元优博运用新技术向更高领域探索
- 科学|太空探索:天文学家在早期宇宙中发现了一个宇宙泰坦!
- 美的|美的张小懿:深耕数智化转型 探索5G与工业互联网的新可能