中年|AI与人类首次空战,5:0大胜!美国40亿次模拟造出个怪物?
本文插图
8月20日 , 美国苍鹭系统公司的人工智能空战系统 , 与一名坐在模拟器中、戴着虚拟现实头盔的人类战斗机飞行员进行空战格斗对抗 , 最后以5:0的绝对优势获胜 。 这场世界首次人工智能和人类的空战大赛 , 表明在空战近距格斗领域 , 人工智能可以超越人类 。 那么 , 人工智能是否会在空军作战中获得巨大发展呢?
本文插图
【中年|AI与人类首次空战,5:0大胜!美国40亿次模拟造出个怪物?】
2019年8月 , 国防高级研究开发局DARPA选择了八个团队 , 包括洛克希德·马丁公司这样的大型传统国防承包商到苍鹭系统公司(Heron Systems)这样的小公司 , 在11月和2020年1月的一系列试验中展开一系列竞争 , 最后苍鹭系统公司在与其他七支球队的较量中脱颖而出获得冠军 , 亚军洛克希德·马丁公司获得亚军 。 而20日人工智能对人类的胜利 , 再次证明深度强化学习路线的正确性 。 即人工智能算法可以在虚拟战争环境中一遍又一遍地训练一项空战任务 , 最终发展“理解”空战的层次 。
本文插图
来自洛克希德·马丁公司的人工智能副总裁马特·塔拉西奥和人工智能总监兼首席架构师李·里索尔茨表示 , 试图让算法在空战中表现良好 , 与简单地教软件“飞”或保持特定的方向、高度和速度有很大的不同 。 人工智能软件一开始甚至对非常基本的飞行任务都完全缺乏理解 , 这使得它一开始十分“菜” 。 一个最普通的人也知道飞机它不应该撞到地面 , 但是算法不知道 。 在训练一开始 , 人工智能经常把飞机开到地面自杀 , 就像婴儿一样 。
本文插图
克服这种无知的“人工智能” , 需要算法训练 , 每个错误都有代价 , 但这些代价并不相等 。 当算法基于仿真后的分析 , 能够为每个动作分配权重 , 然后随着经验的不断更新 , 能够重新分配这些权重 , 就能够逐渐加固人工智能的“战斗意识” 。 但是程序员在如何构建模拟方面的 , 存在有意识和无意识巨大争论 。 是基于人类知识编写软件规则来约束人工智能 , 还是让人工智能通过试错自我学习?这是一场激烈的辩论 。 最后美方选择第二种 , 因为人类的经验有可能限制了它的性能 。
本文插图
尽管已开始是菜鸟 , 但人工智能可以学习的速度有多快是令人震惊的 , 因为它可以在多台机器上一遍又一遍地重复训练 。 洛克希德公司和其他几个团队一样 , 有一名战斗机飞行员提供建议 , 还能够一次在多达25台服务器上训练人工智能 。 而苍鹭系统公司的人工智能算法 , 竟然经历了40亿次模拟 , 等于在1年的时间中获得了至少“12年资深战斗机飞行员的经验” 。 美国目标是最终生产的人工智能产品可以运行在一块GPU芯片上 。
这不是人工智能第一次在比赛中击败人类战斗机飞行员 。 2016年的一次演示显示 , 一名为阿尔法的人工智能特工可以击败一名经验丰富的人类战斗飞行教官 。 但8月20日的模拟对抗意义更大 , 因为它让各种人工智能在高度结构化的框架中相互对抗 , 然后具备与人类对抗的能力 。
本文插图
而且人工智能厂商还认为 , 即便是5:0的结果 , 但实际上对他们来说并不公平 , 因为规则不允许在实际对抗中 , 人工智能来学习对手的经验 。 实际的比赛确实证实了这一点 。 在了第五轮也是最后一轮比赛时 , 匿名的人类飞行员已经能够显著改变他的战术 , 尽管最后失败了但持续的时间要长得多 。 显然人类战斗机飞行员也在学习 , 但是他学的不够快 , 还是失败了 。 而人工智能公司认为 , 如果AI也能在战斗中学习人类对手 , 那么人类败得会更快更惨 。
推荐阅读
- 中年|北斗“一张网”可实现全天候、高精度、自主可控服务
- 中年|Python编程语言有什么独特的优势呢?
- 中年|谈一谈我的十年机械工作经历
- 中年|弹无虚发的背后,国产弹药质量把关人,精密机床都要自叹不如
- 中年|宿迁深圳招商再结硕果,签约项目19个,协议总投资158亿元
- 中年|苹果:已终止Epic Games开发者账号
- 中年|圆满的结局!苹果微信之间不用再二选一,美国政府还是做出让步
- 中年|国家能源集团成功研发矿用卡车能耗制动开关预警装置
- 科学|为什么动物能直接喝脏水,而人类喝水需要过滤?
- |将量子计算机当作神经网络,首次模拟化学反应,谷歌新研究登上Science封面