机器人|美国陆地作战机器人揭秘:大国大杀器( 三 )


几分钟后 , 罗曼还没有动——它仍然坐在那里 , 对着树枝沉思 , 手臂像螳螂一样摆动 。在过去的10年里 , ARL的机器人技术合作联盟(Robotics Collaborative Technology Alliance  , RCTA)一直与来自卡内基梅隆大学、佛罗里达州立大学、General Dynamics Land Systems公司、JPL、MIT、QinetiQ North America、中佛罗里达大学、宾夕法尼亚大学和其他顶级研究机构共同开发用于未来地面作战的机器人自主能力 。RoMan就在这个大项目中的一个代表 。
RoMan正在思考的“清出一条路”的任务对机器人来说是很困难的 , 因为这个任务太抽象了 。在这个任务中 , 罗曼需要识别可能挡住去路的物体 , 推断这些物体的物理性质 , 弄清楚如何抓住它们 , 以及采用哪种最佳的操作技巧(推、拉、提等等) , 然后将这些行为完整地执行出来 。对于一个本就对世界了解有限的机器人来说 , 这个任务的步骤实在太多 , 且充满未知 。
- “模块化”理解世界
ARL操纵和移动项目的人工智能首席科学家Ethan Stump 谈道:“让机器人逐渐理解世界 , 正是ARL所开发的机器人与其他依赖于深度学习的机器人所不同的地方 。”
“军队也许会在世界上的任何地方执行任务 , 但我们不可能收集应用到机器人的所有地域的详细数据 。我们也许会被派去地球另一侧从未涉足的森林 , 但我们也要表现地就像在自家后院一样出色 。”他介绍 , 但大多数深度学习系统只能在它们受训的领域和环境中可靠地运行 。此外 , 如果军队作战机器人的深度学习系统表现不好 , 他们并不能通过简单地收集更多的数据来解决问题 , 数据量有限 。
ARL的机器人还需要意识到自己在做什么 。Stump 解释:“在一项任务的标准执行顺序中 , 你有目标、约束条件、表达指挥官意图的话术 。”换句话说 , RoMan 可能需要快速地清理一条道路 , 也可能需要安静地清理一条道路 , 这取决于任务的具体要求 。即使对目前最先进的机器人来说 , 这也是一个很高的要求 。
在我看着的时候 , RoMan再次搬运树枝 。ARL的自主方法是模块化的 , 其中 , 深度学习与其他技术结合 , 让 RoMan 帮助ARL确定什么任务适合什么技术 。
目前 , RoMan 正在测试两种从3D传感器数据中识别物体的不同方法:宾夕法尼亚大学的方法是基于深度学习 , 而卡耐基梅隆大学使用的是一种通过搜索来感知的方法 , 这种方法依赖于更传统的3D模型数据库 。只有事先确定要寻找的对象 , 搜索感知方法才有效 , 但这种方法的训练要快得多 , 因为每个物体只需要一个模型 。而且 。即使物体很难被感知 , 比如物体的一部分被遮挡或被颠倒 , 搜索感知方法也能准确地识别物体 。ARL同时测试两种方法 , 让两种方法同时运行、相互竞争 , 以选出最通用和最有效的方法 。
感知是深度学习擅长的事情之一 。ARL的计算机科学家 Maggie Wigness 说:“得益于深度学习 , 计算机视觉领域已经取得了极大进展 , 我们已经成功地将一些只在一个环境中训练的深度学习模型很好地泛化到新的环境中 。"
ARL的模块化方法是将几种技术的优势结合起来 。例如 , 基于深度学习视觉对地形进行分类的感知系统 , 可与基于逆强化学习方法(inverse reinforcement learning)的自动驾驶系统一起工作 。在逆强化学习方法中 , 模型可以通过人类士兵的观察迅速创建或优化 , 而传统的强化学习基于既定的奖励函数来优化解决方案 , 通常只有在你不确定什么是最佳行为的时候使用 。这和作战思维不谋而合 , 这种思维通常认为训练有素的人在一旁指导机器人才是正确的做事方式 。
"所以我们想要一种技术 , 让士兵干预 , 结合一些战场实例 。如果我们需要新的行为 , 就可以更新系统 。深度学习技术需要更多的数据和时间 。”Wigness说 。
- 如何安全运行?
深度学习要面临的 , 不仅仅是数据稀疏和快速适应的问题 , 还有鲁棒性、可解释性和安全性等问题 。Stump说:“这些问题并不是只有在作战机器人中才会出现 , 但在军队作战时尤其重要 , 因为它所引起的后果可能是致命的 。” 需要明确的是 , ARL目前并不是在研究致命的自主武器系统 , 而是在为美国军方的自主系统奠定基础 。在未来 , 作战机器人可能就如RoMan一样行动 。


推荐阅读