『博弈游戏』AI研习丨专题:不完全信息计算机博弈的模型与应用( 二 )


同样的 , 在二打一(斗地主)中 , 由于不能事先知道其他参与者手中的牌和底牌的分布 , 因此玩家不能乐观地认为自己叫牌成功后 , 底牌一定会对自己有帮助 。 也不能确定其余34 张牌是如何分配在另外两位玩家手里的 , 是否会组成更强的牌 。 因此多数玩家会在手中的牌有很大的优势或成功率时才会叫牌 , 而不是高于平均水平就叫牌坐庄 。 很多资深玩家在初期信息不足的情况下 , 往往宁可不使用炸弹而失去高分 , 也要避免由于对手牌的分布刚好不利于自己而由得变失 。
在研究中发现 , 由于不完全信息博弈中信息的不对称性 , 往往要付出很大的代价来换取信息 , 在设计引擎时要仔细考虑所付出的代价是否与带来的收益相符;同时 , 在设计棋谱时 , 也要侧重与信息的描述 , 这样的棋谱实际应用价值更高 , 阅读者获取的收益也会更大 。
3.2 博弈规则、对战平台和交互协议的设计
计算机博弈研究中比赛是检验研究成果的主要方式 。 为了提高比赛效率 , 往往需要使用独立的比赛对战平台系统 , 加载比赛选手引擎完成对局 。 但是由于不完全信息的特征 , 所设计的平台需要充分考虑对需要保护信息的特殊需要 。 因此 , 对战平台应该准确区分哪些信息是可以提供给哪些玩家的 , 哪些信息是需要加密保存的 。 在设计选手引擎与裁判平台交互的协议时 , 也要把握好交换信息的尺度 , 对各种棋位和棋子或牌花色点数进行高效的编码 。
博弈游戏是人们对智力的锻炼工具 , 博弈游戏的规则要满足以下的两个条件 。
(1)博弈规则对游戏双方尽量是公平的 。
(2)博弈结果应尽量避免平局 。
在设计军棋计算机博弈规则时 , 考虑到传统军棋规则并未对消极防御有任何惩罚约定 , 所以很多选手倾向于不进攻对方 , 使对局很容易陷入平局 。
『博弈游戏』AI研习丨专题:不完全信息计算机博弈的模型与应用
本文插图

『博弈游戏』AI研习丨专题:不完全信息计算机博弈的模型与应用
本文插图

选自《中国人工智能学会通讯》
2020年 第10卷 第2期 机器博弈专题


推荐阅读