来源:SME公众号 3月9日可能会成为写入人类史册的一天——持续五天的谷歌AlphaGo大战李世石开始,一场世界上最会下围棋的人与人工智能的超级对弈,被全人类通过网络直播共同围观。 在赛前,围棋界和科学界的很多人都对这场比赛做了预测。谷歌对自己开发的机器人信心很足,声称根据电脑计算的结果,李世石打败“阿尔法狗”的概率为0,。而围棋界则多数站在李世石这一边,中国棋圣聂卫平认为李世石败北是不可能的事情。 而就在这第一场比赛中,李世石在前期优势的情况下不敌“阿尔法狗”,并在终局宣告认输。而在赛前,李世石曾自信表示自己能够赢满5盘。所以说flag不要乱立。 笔者认为,李世石输给人工智能是迟早的事情,只不过没想到会来得这么快而已。因为“阿尔法狗”并不是像当年的深蓝一样用穷举法打败人类,而是结合了深度神经网络机器学习方法和树搜索算法。 神经网络算法在一定程度上模拟了生物神经分层的构架,不仅能够不断调整优化各项行动的逻辑权重,还能够进行结果的反馈,把结果重新作为输入进行训练。谷歌的DeepMind团队把这项算法附加在博弈树上,就有点像棋手进行复盘一样,反复加强之后可以对落子的位置形成一定的优先级筛选。 这种做法看似依然需要大量运算,却和先前有着极大的区别。当机器进行反复的训练后,它们对某些情况下的落子位置概率会变得很低。换句话说,它们可以跳过这些位置的运算,而非全部再计算一通。这些算法的进步实际更加符合人类的思考和学习方式。我们人类并不是掌握了全部的信息和预测之后才能做出决策的,我们只能尽力追求在自己的能力范围内“满意”的答案,而不是非要找到那个最优的答案。 所以这就是“阿尔法狗”最厉害的地方,他不是一个机械的编码程序,他有一个“监督预判机制”,每走一步,他会考虑这种走法是不是更有前途,这是一种类似“想象力”的能力。、 再来说一下这盘棋本身。最开始,李世石采用了很不常见的下法,大概推测,小李因为对手是电脑,刻意做了针对,以求避开“阿尔法狗”的棋谱库。 在中间的时候,李世石一度取得了优势,不少网友都评论道,如果李世石不出昏招就稳赢。但后面由于一些意味不明的失误,李世石已经回天乏力了。 整盘棋就是右上角的打入起到了转折性的作用,这一步也充分体现了算法在人类面前的巨大优势。在比赛限时的情况下,那一着的计算量确实是相当大的,估计李世石也觉得那个部分有余味,但也想不到白棋就这样长刀直入地切进去,打出优势。 正如许多人所说,ai的优势很大一部分来自于局部计算的精细,但从宏观上讲,优势更来自于时间的分配。像这样计算量巨大的变招,人类去分析所花费的时间在比赛里所占的比重实在太大,再加上万一你花了半天计算出来这里其实没有棋可下,时间就被浪费了。因此,在比赛过程中人类会因为时间规划的原因而永远无法做到整体优化同时局部细致的全面分析,而这正是算法的巨大优势。 那位在上个世纪九十年代败给电脑的国际象棋大师Garry Kasparov其实也表达过类似的观点。早期象棋机器会有盲点和可加利用的弱点,而且吸引棋手的是将利用这些弱点作为目标,而不是正儿八经对弈。对战深蓝时,他就没有抵挡住这一诱惑。 象棋和围棋,需要高度集中精神,当你的注意力被试图对计算机耍花招打乱时,最终就是诱导自己下出客观上并不可靠的棋招。人类和机器关键差异就在于机器有着不间断保持前后一致的优势。计算机不会犯下大错,而人类则失之毫厘谬以千里。机器也不会苦于骄傲自满、焦虑和筋疲力尽。 有些人比较担心,人工智能在围棋上逆打败人类,会不会毁了围棋这项运动。但你看九十年代被攻下的国际象棋,它现在依然是好好的。棋子落在棋盘上,本来没有任何意义的。因为有了规则,有了胜负,一颗颗棋子在棋局中才有了意义,才有了审美价值和艺术价值。一台能在胜负上不断追求更高境界的机器,在超过人类之后,其本身不也是具有价值的吗? 关于剩下的四场比赛的结果,预测的人也很多,笔者在这里也不就不掺和了。但毕竟李世石已经达到一个巅峰,而“阿尔法狗”尚还处于学习状态,并且它能够在每一场棋局中学习李世石的风格,并计算出有效的应对方式。或许李世石后面的比赛会越来越难。但李世石毕竟是一位职业棋手,这种快速调整心态的能力应该是不差的。只要心态不出问题,后面再扳回来也是有可能的。 参考资料/知乎、网易、机器之心 烂柯围棋手机版全新上线,下围棋、看直播,来烂柯围棋,边读新闻边打谱。 |