你玩《2048》能拿多少分？AI的最高分纪录：401912 那会是怎样一种画面？现...

鱼羊发自凹非寺
量子位报道|公众号QbitAI
如果让AI来玩《2048》这样的游戏，那会是怎样一种画面？
现在，有人用强化学习方法实践了起来。
于是，插上DQN的翅膀， AI从零起步，自己琢磨出了《2048》的玩法：
一起手，是不是就有内味了？
这操作，条理清晰到令人感到舒适。 “1000 ， no；1024 ， yes”的强迫症们不禁纷纷点赞，给这只AI贡献了800+reddit热度。

文章图片

用DQN玩《2048》
调教出这只会玩《2048》的AI的，是一位巴西老哥FelipeMarcelino 。目前正在米纳斯吉拉斯联邦大学攻读CS硕士。
首先，他采用OpenAIGym构建了自定义强化学习环境。
其中包括两种2048棋盘表示方式：
二进制——使用二次幂矩阵表示棋盘中的每一块区域
非二进制——原始数字矩阵
模型包含两种类型的神经网络：CNN和MLP（多层感知机）。

文章图片

据Felipe介绍，与MLP相比，以CNN作为特征提取器的智能体表现得更好。
训完之后，老哥测试了一下，在1000把游戏中， AI有100次达到了2048 。
玩《2048》的AI们
目前，这只用DQN训练出的AI玩到2048就打住了。
不过，巴西老哥抛砖，又吸引了不少来献玉的盆友。
比如，同样采用强化学习方法，将时序差分学习和最大期望搜索相结合的2048控制器。
在10步/秒的策略下，它最高能凑出32768 。

文章图片

而在追求高分的路上，有一位来自日本的选手表现亮眼。
依靠7个卷积层的深度卷积网络，这只在《2048》这个游戏中最高拿到了401912分。

文章图片

正如一位网友所说：这正是一个足够有趣，又不太复杂的强化学习案例。

文章图片

如果你是刚刚开始学习强化学习，也不妨拿这个小项目练练手~
参考链接
《2048》相关开源项目：
https://github.com/FelipeMarcelino/2048-gym
https://github.com/aszczepanski/2048
https://github.com/thomasahle/mcts-2048/
相关论文：
https://www.jstage.jst.go.jp/article/ipsjjip/27/0/27_340/_pdf
http://arxiv.org/abs/1604.05085
【你玩《2048》能拿多少分？AI的最高分纪录：401912】—完—

你玩《2048》能拿多少分？AI的最高分纪录：401912

推荐阅读

过午不食一年多并且坚持锻炼身体很多毛病没了长期下去是不是对身体有好处?

在simulink里如何实现模数转换 simulink数模转换模块

绍兴,农副产品出口势头强劲茶叶等出口大幅增长

紫色|能hold住紫色的，多半都是这样的美女！

累的说说心情短语?工作疲惫的句子说说心情?

冰红茶能降火吗,冰红茶加香精

旅行者@旅行者一号再度发回重要信息，验证了霍金理论，科学家却难以接受

萱草|微信设置15分钟“转账冷静期”对短视频中付款用户进行保护限制

杨幂|杨幂情人节晒睡衣美照，扎双麻花辫俏皮灵动如初恋，戴戒指引猜疑

中东|综合消息：中东多国疫情持续蔓延部分国家放松防控措施

铁血大讲坛：这个举动比日本还可怕，俄罗斯发出警告，韩国迈出最危险的一步

敌人|LOLSamira技能正式曝光，新ADC萨米拉技能效果详情

世行：全球天然气燃除量跃升至2009年以来最高水平

『汽车之家』Countryman JCW，300马力5秒破百，2020款MINI

苹果|曝iPhone 15 Pro Max要用潜望镜头：苹果又有涨价的理由了

雷科技|Find X2 英雄联盟版：限3000台，抢到赚到！OPPO

御龙美玉行|山?矿紫泥.380cc 范林强，【圣桃壶】一?两壶?杯

功效|香菜有人爱有人恨，4大功效不容小觑！但6种人无福消受！

对外事务|副总裁陶琳引咎辞职?特斯拉:谣言曾称我们没办法妥协

沈阳日报|城建重点工程长假期间“不停工”