主页 > 资讯 > “AlphaGo首出Bug，围棋算法的死穴在哪儿？”

“AlphaGo首出Bug，围棋算法的死穴在哪儿？”

来源：网络转载更新时间：2021-09-21 14:33:55阅读：

在韩国围棋界，获得多项世界冠军的职业九段李世石在与谷歌电脑alphago的人机大战中，3连败后，白手起家挽回一局。

大众把这场围棋人机大战看得太重了，看成是人脑和计算机的彻底竞争，其实不然。因为，进行比赛就像下围棋一样。如果人类在围棋人机大战中输了，人类的大脑也并不会比不上计算机。

事实上，围棋变化多端，纷繁复杂，但理论上并不是无限的。只不过可以看成是数学主题，用计算机编程运算得到答案。在假时间里，人类在国际象棋这方面迟早很难与计算机匹敌。即使李世石3连败后，挽回了2局，那又如何呢？在围棋方面，人类迟早比不上人工智能。

围棋人工智能的第一代算法采用穷举法，计算所有的棋步，选择必胜的棋步。但是围棋的一些变化太多了，一时半会儿不会。

第二代算法是在抽样判断中选择胜率高的算法，大幅削减运算量，使得人工智能终于能够与业余围棋选手竞争。

Googlealphago是第三代算法，利用人工智能的自我学习能力飞跃性地提高了自己的象棋实力。看起来辗压世界职业高手的阿尔法·戈在第四局中遭到了冷遇，有什么问题呢？

阿尔法go的算法有问题。第三代算法的问题实际上也是第二代算法的问题。因为第三代算法基于第二代算法的采样判断进行自我学习。即使alpha go能和自己下国际象棋提高棋艺水平，它也能这样下国际象棋是基于抽样判断的。

抽样判断有弱点。胜率高的下法未必是正确的下法，只不过是统计。有些冷门的方法，反而可能会赢得惊人的胜利。

阿尔法go下臭棋时，思考速度特别快恰恰证明了此时样本很少。李世石78手是奇招，下这一手的棋手很少，阿尔法go按照程序运算后认为李世石的胜算不高，反应特别快。这是个大错误。

在围棋程序下象棋的棋手，感觉在计算机处于劣势时的应对非常混乱。不仅是阿尔法go，zen也是。电脑处于胜率低的状况，已经很难考虑了。根据样本统计，在胜率低的情况下当然输赢多，逆转取胜的样本很难找。胜率越低的情况下，alpha go的想法越混乱。极端的情况下，找到的样本中胜率低的一方已经认输，可能没有之后的棋谱。我不擅长阿尔法戈该怎么办。

阿尔法GO的失败也是人类的失败，毕竟程序也是人类编的。另一方面，由于算法基于人类样本，导致了alpha go的失败。如果李世石手上有对应的样本，alphago也不会这样评价错误。

alpha go的父亲哈比斯说:“alpha go的训练并不是特别要和李世石比较，而是让普通棋手像比赛前一样，只做日常的准备。阿尔法go准备就是从网上下载很多业余棋手的棋谱研究，没有什么特别之处。之后，和某棋手进行比较准备也不容易，我们至少需要几百万到几亿的棋谱，只有整体提供给alpha go，才能接收它进行深度学习。

哈比斯的话也证实了围棋人工智能第二代第三代的死穴，也就是样本判断的问题。李世石逆转取胜的奇招，能找到的样本很少。阿尔法go显然有很多职业棋手的质量很高，需要参考非常全面的对局，这是行不通的。

围棋难题还得处理

第四局，李世石交手反而能赢，这很不可思议。因为奥赛罗有先手的特点，胜率很高。

人机大战引出了长期困扰围棋界的问题。是围棋规则中关于贴目的的规定。不下围棋的人可能不知道，但围棋迷很清楚。国际象棋棋手是先手，有其特点，所以为了公平起见，黑棋棋手需要盯着白棋棋。

1949年(昭和24年)日本棋院围棋规则规定，黑方贴4目半。从1955年第三期王座战开始，黑棋贴目从4目半变更为5目半。但据统计，黑方仍占特点。截止到2001年底，在日本棋院近5年进行的1.5万局官方公开对局中，(黑胶5目半的情况下)黑胶胜率达到51.86% )。虽然黑白胜率差别不大，但在激烈的围棋比赛中，这种差别是致命的。

在国际比赛中实力明显优异的韩国，在很多比赛中都转入了第6轮半制。中国也从2002年春天开始，全部改贴3/3/4子(相当于7目半)。日本棋院对50年来实行的黑白棋5目半的制度也进行了改革，使一部分比赛接近中韩，从2003年开始使用了所有黑白棋6目半的规则。

截止到年底，中国大陆主办的第3局和第3/4局(相当于7局半)世界锦标赛共有380局对局，其中小黑赢了200局，胜率为52.6% ( )前3局春兰杯相当于5局半，未计入)。另一方面，在台湾举行的应氏杯( 8点贴，相当于7目半)为黑胜100局、白胜97局。据此，即使贴上7目半，黑色似乎也有点特色。

那么，到底黑侧对白侧盯上多少才是公平的呢？现在，这个数值是根据很多人的对局统计计算出来的，在数学上并不是完美的答案。

说不定是阿尔法go让金庸武侠小说的周伯通和郭靖左右势均力敌，用左手和右手下棋，根据大量内战结果统计了粘贴目的的合理数值？ o，这也不是完美的解答。

如前所述，alpha go之所以能自己下棋，还是根据与人类对局的抽样来判断的。这和直接统计人类对局没有区别。

完美的解答，还是要回到开头，用原始的穷举法，找到下围棋的优秀解。这样，就可以彻底确定粘贴目的的数值。只是，运算量这么大的工程，不知道什么时候才能实现。

想象一下围棋被彻底解读后的样子。某国际围棋大赛开始引起全世界的关注，手持黑手的棋手获得了第一个孩子。裁判马上宣布，手持白手的棋手不必再干了。比赛结果已经确定，很明显是谁赢了还是打成平局。观众发出了欢呼声。

阿尔法go打麻将是如何兼具桌游设计的随机性的？

虽然围棋人机大战人类输了，但一些网民表示，人类的智慧中还保护着中国麻将。 (详情请参阅钛媒体的文案“赢了围棋也没什么大不了的。阿尔法狗敢挑战麻将吗？ |是钛做的)。但是，中搜网络创始人、北京围棋业余比赛陈沛对采访他的记者说:“如果是麻将，人类会输得更惨吧！麻将一共那么多，很容易计算。

但是陈沛的话其实是错的。如果有一棵傻大树，他麻将打得不怎么样，但是他运气好，快要爆炸了，一开局就自己摸13吗？阿尔法go有破解度高的招数吗？

麻将之类的棋牌游戏是随机抽牌的，所以有运气的因素。

一位网友对戏言说，如果麻将时三人联手对付阿尔法go，阿尔法go会输得很惨。这是作弊，但也有大问题。多人游戏中，局面非常多且复杂，人工智能该如何应对呢？

例如，3只身体在和alpha go打麻将，没有人作弊，但是甲玩家技术不行，错了牌，乙玩家受益。这是阿尔法go无法控制的。

本来，alpha go学习麻将也必须根据与众多人类对局的样本来判断。阿尔法go只知道什么样的打法胜率高，但是麻将没有必胜的打法。

围棋棋子摆在棋盘上是有目共睹的。你听说过倒扣将棋棋子玩的黑暗将棋吗？陆战队员也有暗手的游戏。麻将实际上也类似于国际象棋的游戏。卡片加盖玩。建造的棋牌是什么，还得推测。阿尔法go最多通过计算来判断，被覆盖的棋牌是什么的可能性很高，无法通过正确的推论得到结果。也就是说，阿尔法go只有永远获胜才能进化。

围棋没有运气的要素，麻将有运气的要素，哪一个都有吸引力。

从广义上说，围棋、麻将这些棋牌游戏，其实属于桌游的范畴。围棋英语是go，阿尔法GO GO就是从那里来的。围棋进入bgg桌游排行榜前100名，中国国际象棋卡牌类游戏排名很高。

在民间，象棋和围棋这种没有运气要素的棋牌(桌游)正在没落。现在关注围棋人机大战的网民是围棋迷吗？

因为大众想要的是更娱乐的。像象棋和围棋这样没有运气因素的，游戏水平比较稳定。他是名人。普通人不容易赢。除非你能找到象棋力量正好和你水平差不多的东西，否则玩起来没意思。强的东西太强了，太弱了。

因此，新兴桌游的设计宗旨必须保证随机性，具有运气因素。像万智牌、游戏王、炉石传说那样随机抽牌，像国际象棋和大富翁一样掷骰子，都会产生随机数，带来运气成分。如果有运气的要素，所有玩家发挥的水平就不会太大不同，可以聚在一起开心地玩。

另一方面，没有运气因素的棋牌(桌游)，理论上一定会存在优秀的解，所以一旦出现优秀的解，一定会引起兴趣。围棋变化太多，至今也没有优秀的解，所以一直活到了今天。现在，阿尔法go并没有完全打败李世石，围棋的生命力看起来还很顽强。

心灵鸡汤：

标题：“AlphaGo首出Bug，围棋算法的死穴在哪儿？”

地址：http://www.n4ti.com/nbzx/27496.html

免责声明：宁波晚报为您24小时滚动报道宁波新闻,宁波资讯,宁波时事等资讯。部分内容来自于网络，不为其真实性负责，只为传播网络信息为目的，非商业用途，如有异议请及时联系btr2031@163.com，宁波晚报的作者将予以删除。

上一篇：没有了

下一篇：“写新闻稿机器人上岗：仅用0.3秒完成一篇软文”

宁波晚报推荐浏览

2020宁波奉化消费券可以每周领取吗？

2019年世界数字经济大会将在哪里举行？什么时候举行？

如何申请宁波企业复工？附加申请流程

2020宁波宁海消费券发行指南(时间+入场+收款方式)

2020年奉化消费券活动将持续多长时间？

我什么时候能拿到2020宁波消费券？

2020年宁波北仑区企业券使用范围一览表(附使用规则)

收集2020慈溪消费券的方法有哪些？附在收藏入口

如何使用北仑消费券？有使用规则

2020年宁波镇海区第三批复工企业是什么？

“AlphaGo首出Bug，围棋算法的死穴在哪儿？”

宁波晚报本月热门

宁波晚报最近更新

宁波晚报网介绍