MiHomes:电脑已经向我们学习了。但是他们能自学吗?( 二 )


他说 , 对于人工智能的未来 , 一个更具包容性的术语是“预测性学习” , 这意味着系统不仅能识别模式 , 还能预测结果并选择行动方案 。 “每个人都同意我们需要预测性学习 , 但我们不同意如何达到这个目标 , ”萨顿博士说 。 “有些人认为我们是在监督学习理念的基础上发展起来的;其他人认为 , 我们是通过强化学习理念的延伸实现这一目标的 。 ”
彼得·阿贝耳是加州伯克利机器人学习实验室的负责人 , 他使用强化学习系统 , 通过一种叫做自我游戏的方法 , 与自己竞争 , 以更快地学习 。 例如 , 相同的模拟机器人相扑 , 起初并不是很好 , 但很快就有所改进 。 “通过与你自己的水平或与你自己对抗 , 你可以看到什么样的变化有助于逐渐积累技能 , ”他说 。
尽管强化学习很强大 , 但勒肯博士说 , 他认为其他形式的机器学习对一般智力来说更为关键 。 “我的钱都花在自我监督的学习上了 , ”他说 , 指的是那些接收大量未标记数据的计算机系统 , 它们在没有监督或奖励的情况下理解这些数据 。 他正在研究通过观察学习的模型 , 积累了足够的背景知识 , 可以产生某种常识 。
“想象一下 , 你给这台机器一段输入 , 比如一个视频剪辑 , 然后让它预测下一步会发生什么 , ”莱坤博士在纽约大学的办公室里说 , 他的办公室装饰着电影《2001:太空漫游》的剧照“为了让机器训练自己做到这一点 , 它必须开发一些数据表示 。 它必须明白 , 有些物体是有生命的 , 有些是无生命的 。 无生命的物体有可预测的轨迹 , 而其他物体没有 。 ”
他说 , 在一个自我监督的计算机系统“观看”了数百万个YouTube视频之后 , 它将从这些视频中提取一些世界的代表 。 然后 , 当系统被要求执行一个特定的任务时 , 它可以利用这个表示——换句话说 , 它可以自学 。
麻省理工学院-国际商用机器公司沃森人工智能实验室的考克斯博士也在进行类似的工作 , 但是他将更传统形式的人工智能与他的实验室称之为神经符号人工智能的深层网络相结合 。 他说 , 目标是建立一个人工智能系统 , 能够获得与人类相似的常识知识的基线水平 。
“我们在日常工作中所做的很大一部分就是不断完善我们对世界的心智模型 , 然后用这些心智模型来解决问题 , ”他说 。 “这概括了我们希望人工智能做的许多事情 。 ”
许多人希望机器人最终能体现人工智能 , 并在世界上自由行动 。 但要让他们达到目标 , 需要的不仅仅是监督学习 。 目前 , 机器人只能在定义明确、变化很小的环境中工作 。
MiHomes:电脑已经向我们学习了。但是他们能自学吗?
本文插图

自从人工智能发展以来 , 技术的界限已经被打破 , 挑战它比人类思考和行动更快 。 最优秀的人才与机器竞争 , 看谁能胜出 。 在这里 , 我们回顾一下人类和计算机之间的一些最好的竞赛 。
伯克利的助理教授谢尔盖·莱文(Sergey Levine)说:“我们的工作假设是 , 如果我们构建了足够通用的算法 , 那么一旦完成了 , 我们真正要做的就是将它们放入机器人中 , 让它们在现实世界中做真实的事情 。 ”他经营着该大学的机器人人工智能和学习实验室 。
他正在使用一种自我监督的学习方式 , 在这种方式中 , 机器人探索他们的环境 , 并建立起勒昆博士和考克斯博士正在谈论的基础知识 。 “他们只是在自己的环境中玩耍和学习 , ”莱文博士谈到实验室的机器人时说 。 “机器人本质上是在想象可能发生的事情 , 然后试图找出如何让它发生 。 ”
通过这样做 , 机器人积累了大量的知识 , 可以在新的环境中使用 。 最终 , 机器人可以联网 , 这样它们就可以分享各自获得的知识 。
“一个机器人花几个小时摆弄一扇门 , 来回移动 , 它就能打开那扇门 , ”莱文博士说 。 “我们有六个不同的机器人 , 所以如果我们让他们都玩不同种类的门 , 也许当我们给一个人一个新的门时 , 它实际上会推广到那个新的门 , 因为它已经看到了足够的多样性 。 ”


推荐阅读