环球Tech|如何提高训练机器人的效率?外媒:正强化法
【***科技综合报道】10月27日消息 , 据外媒报道 , 约翰斯·霍普金斯大学博士生安德鲁·洪特(Andrew Hundt) 近日发布一篇新论文 , 指出应通过正强化法训练机器人学习新技能 。
【环球Tech|如何提高训练机器人的效率?外媒:正强化法】这篇论文的核心思想是 , 在训练机器人的过程中 , 应采用正强化法 , 即相比于在它做错时进行惩罚 , 更应在它做对时进行激励 。 而对于机器人来说 , 这种激励机制是以评分系统的形式呈现的 , 类似玩游戏一样 , 根据执行任务的情况获得积分 。
本文插图
安德鲁表示 , 这种方法能够大大缩短训练机器人执行任务的时间 。 “机器人希望能得到更高的分数 , 所以它们很快就可以完成相关任务 。 过去机器人需要一个月的练习才能达到100%的准确性 , 现在只用两天就能做到 。 ”
不过他也指出 , 目前机器人执行的这些任务仍然是比较初级的 , 比如堆积木 。 但在未来 , 机器人有望通过正强化法完成更复杂和有意义的任务 。
推荐阅读
- |2020环球“金趋势奖”年度赋能创新奖项候选——医渡云
- 聚韬品牌策划公司|如何准备一个好的商业计划书,10分钟打动投资人?
- 芯片|热钱涌入引“虚火之忧” “中国芯”如何浴火新生
- 苹果手机|iPhone 12 mini拆解图揭示苹果是如何给设备瘦身的
- 数码|强迫症患者的幸福生活 篇十三:蜗居共享经济,如何彻底榨干你家里的电子设备
- 新全球化智库|中国企业如何到海外资本市场澳交所上市融资热点连接:中国企业如何到海外资本市场澳交所上市融资
- 富前程社群裂变|富船长:如何调研客户痛点?
- 环球网|两院院士加盟 TCL科技新一届董事会履新
- 银杏|满大街可见的银杏,怎么就比大熊猫还濒危?
- 环球网|长安汽车、华为、宁德时代三方宣布联合打造高端智能汽车品牌