Alpha Go的策略会不会是刚好克制目前人类选手的策略

不完全是的。
因为Master对AlphaGo Lee版本可以让三个子,对人不一定能让三个子,也就是Master对其他电脑有可能比对人强得多了。

■网友
泻药。
我只是围棋小白,弈城只有十四五级的水平,对人工智能也了解不多。但是这两个领域恰恰都是我感兴趣的,多余的时间打法在下盘棋对我来说是很好的消遣,我也很关心人工智能在未来的人类社会中能够扮演什么样的角色,有生之年能不能见证科幻小说的情节一步步变为现实?
回到题主的问题:阿尔法狗是“学习”人类的棋谱来“学会”围棋并以惊人的速度来“精进”自己的“棋艺”的,所以对于人类棋手的每一步棋它都可以说是“意料之中”,所以题主将其理解为“刚好克制人类棋手”,是一种策略。
我认为这种理解,或者说这种表述是不准确的。
【Alpha Go的策略会不会是刚好克制目前人类选手的策略】 策略这种东西是人类之间的对弈才有的东西,阿尔法狗没有所谓的“策略”。我们不能用人类的那一套概念来理解人工智能。不管对面坐的是李世石、柯洁、还是我,阿尔法狗都一视同仁,不需要什么策略的变化。在程序员写对了所有围棋规则的代码的前提下,狗狗只要有超强的计算能力就够了。
在计算能力上,人类棋手与狗狗根本不能相提并论,后者只能用“棋感”、“经验”之类的东西弥补。所以长久来看,未来人工智能与人类棋手的对决没什么悬念,只要人工智能载入了正确且足够多的围棋规则,人类没机会能赢的。
此前一直有人研究狗狗的招法,然后声称发现狗狗也是会“犯错误”的,只是“不会犯决定胜负的错误”。这又是以人类的概念来理解程序了。对狗狗来说,不关系胜负的错误,根本就不是错误。毕竟狗狗对这个游戏的程序设定就只有一个——“赢”,也就是在棋盘上占到比对方多的目数。所以狗狗不在乎不关系胜负的落子是不是所谓的最优,赢半目还是赢200目对狗狗来说没区别,在不关系胜负的若干个点上,狗狗的设定也许是“随机”,那就是我们人类所认为的“错误”。
策略这个概念也是一样的。狗狗最终会趋于无敌于人类起手,就像汽车和人的双腿一样。这最终取决于它的代码是不是完美。

■网友
AlphaGo Zero没有人类棋谱,按照规则进行自我对弈,等于像是围棋刚发明的时候,啥都不会,自己下自己总结,自我学习。


    推荐阅读