当前位置: 华文星空 > 心灵

人类文明中有哪些无比悲壮的场面?

2019-12-17心灵

最完美的失败——三年前,人类与AlphaGo的最后一战

(本文首发于微信公众号:奇略研究所)

1.

2017年5月25日,中国乌镇。柯洁对战AlphaGo三番棋的第二局。

这局棋前一年,AlphaGo以4比1的总比分将十四次世界冠军得主、韩国传奇名将李世乭挑落马下。李世乭首局落败之时,曾有中国少年放出豪言壮语:「就算阿尔法狗战胜了李世石,但它赢不了我。」

一石激起千层浪。互联网上最初对那位少年的质疑,迅速被更响亮的惊叹与赞誉淹没。围棋界冉冉升起的超新星、战胜李世乭获得梦百合杯冠军、世界排名第一的柯洁九段,当然有资格说那句话。当李世乭九段遗憾落败之后,柯洁顺理成章地被捧为「人类的最后一道防线」。

然而,AlphaGo不会蹲在原地静等柯洁的挑战。既然与李世乭的决战暴露了AlphaGo的弱点,DeepMind团队马不停蹄,全身心投入AlphaGo的升级工作。2016年春季开始,DeepMind并行开发AlphaGo的两个升级版本——AlphaGo Master和AlphaGo Zero.

2016年末AlphaGo Master在网络对弈平台上对人类职业高手取得60胜0败的战绩,其中包括战胜柯洁的两局。AlphaGo不仅曾经的弱点不复存在,还改编了人类习惯的定式,棋艺境界深不可测。

2017年初,坊间传出柯洁将在年内正式挑战AlphaGo的消息。只是,因为AlphaGo Master的强势,几乎没有人认为柯洁还有机会获胜——哪怕是赢下系列赛中的一局。

即使全世界都不认为他会获胜,柯洁仍然相信自己有机会。2017年3月18日,柯洁做客央视访谈节目【朗读者】,朗读【哈利波特与死亡圣器】选段,献给「来自未来的对手」。「伏地魔死了」,在主持人董卿的请求下,柯洁以充沛的感情将这五个字重复了一遍。显而易见,柯洁希望能像哈利波特一样,战胜他即将面对的那个「伏地魔」。

2.

哈利在与伏地魔血战之前,至少已经摧毁了伏地魔的所有魂器,找到了伏地魔的弱点。相比之下,AlphaGo Master没有弱点,因此所有人都觉得她不可战胜。

面前是一条用先进科技武装到牙齿的巨龙,屠龙勇士仍然主动挑战。五百多年前,罗马帝国皇帝君士坦丁十一世做出了同样的选择。

1451年,年仅21岁的穆罕默德二世正式继承奥斯曼苏丹之位。彼时,奥斯曼帝国幅员辽阔,地跨欧亚,国力日盛。相形之下,曾经辉煌的罗马帝国,如今只剩下君士坦丁堡一座城池。鉴于悬殊的实力对比,罗马帝国的前任皇帝权且臣服于奥斯曼,成为后者实质上的附庸。

然而,正如【六国论】所言,「以地事秦,犹抱薪救火」,暂时的臣服不可能满足强敌雄心勃勃的征服欲。对于罗马皇帝君士坦丁来说,逆转乾坤的唯一希望,在于送给敌人一场失败。奥斯曼帝国的上一次危机,正是源自军事失败引发的内乱。如今奥斯曼新君即位、主少国疑,这或许是战胜敌人的良机。

可是,君士坦丁手里缺少能与土耳其人对抗的力量。帝国的财政状况每况愈下,甚至都供养不起一支像样的常备军。两千年的罗马帝国,手上最后的筹码只剩下「世界渴望之城」君士坦丁堡,以及这座城市的守护者——狄奥多西城墙。

千年以来,狄奥多西城墙经匈人、阿瓦尔人、阿拉伯人、罗斯人、保加利亚人围攻而屹立不倒。尽管这一次的敌人空前强大,但城墙多少能抹平实力上的差距。只要奥斯曼人的围城陷入僵局,西方的同宗兄弟就有时间组织援军。届时,奥斯曼人将腹背受敌,穆罕默德二世的失败也就近在眼前了。

这是君士坦丁计划中的一场豪赌。以君士坦丁堡为筹码,引诱穆罕默德率大军前来近身肉搏。成功几率不高,却已经是最好的方案了。

3.

成功几率不高,却已经是最好的方案了。

首局挑战AlphaGo的失利,让柯洁更坚信自己的判断。5月23日的第一局,执黑的柯洁尝试与AlphaGo比拼内功。而AlphaGo Master超凡的形势判断能力,把棋局早早带入她的掌控之下。棋局的差距始终没有拉开,到最后AlphaGo甚至只赢了1/4子——中国规则下棋局的最小差距。但柯洁心中已明了,与AlphaGo较量功力,甚至都不能算是对抗,而更像一场猫鼠游戏。只有像前辈李世乭那样,在实战中逼出AlphaGo的漏洞,才有一线胜机。

胡耀宇八段接受澎湃新闻采访时,提出了相同的方案。他解释说,要想找出AlphaGo的软肋,就是要将自己和对手一同推到悬崖边上,只有这样才能让接近最优下法的AI出现失误。

问题是,即使目标是「将自己和对手一同推到悬崖边」,已是非常困难的任务。人类高手与AlphaGo Master的60盘网络对局,无一例外在开局五十手内就不知不觉落入明显下风,到一百手时局面几无挽回余地。虽然有几位棋手尝试挑衅AlphaGo,以期在近身搏斗中打败对手。但AlphaGo凭借早早建立起的优势,轻飘飘地避开,安全运转,令人类无计可施。

要想实施悬崖边决斗的计划,就不能在布局阶段被AlphaGo拉开差距。第二局柯洁将执白棋。执白的柯洁曾在2015年谱写一段不败传说,秘诀是他对白布局超越同时代棋手的独到理解。这一次,面对来自未来的对手,柯洁还能赢吗?

4.

5月25日上午,柯洁入座。坐在棋盘对面、代表AlphaGo落子的,是AlphaGo Master项目的负责人黄士杰博士。相比于AlphaGo在棋盘上的天马行空,棋盘前的黄士杰更像一尊机器人。在代表AlphaGo执子对战李世乭、柯洁的八局棋期间,黄博士始终保持着平静的神情,甚至没有去过一次洗手间。棋手们习惯通过观察对手情绪变化来判断局势,或制定策略。而现在对面是一位「机器人」,柯洁只能靠自己了。

AlphaGo执黑棋,第一手落在右下角,小目。后台的分析模式显示,黑方胜率47%。中国规则下,黑方终局结算时须贴还白方3又3/4子,以平衡先手优势。此规则实际上对白方稍微有利,因此AlphaGo给出黑白开局胜率47对53的判断。3个百分点的初始优势,这是柯洁手上唯一的筹码。

3个百分点,无比脆弱的优势。人类棋手布局阶段一个不起眼的失误被AlphaGo抓到,这3个百分点就会随风而去。网络对战AlphaGo的六十盘棋,人类的胜率总是在前五十手就跌破35%。不仅胜利遥不可及,就算是在前半盘抗衡AlphaGo,也变成一种奢望。

然而,柯洁以一种不可思议的方式,打破了AlphaGo Master前五十手大优势的神话。当棋局进行到五十余手时,DeepMind首席执行官戴密斯·哈萨比斯(Demis Hassabis)发布推文称「不可思议!根据AlphaGo的判断,柯洁目前表现完美。」

哈萨比斯在「完美」前面没有加「几乎」之类的形容词,直白地赞美柯洁的表现。当时只有DeepMind团队能看到后台数据,而今天,我们能通过AlphaGo 官方的布局教学工具,直观地感受「完美」的具体含义。

棋谱中的青色虚线圆圈表示AlphaGo推荐的选项,蓝色实线圆圈表示人类棋手常下的其他选项。从图中可以看到,棋局的前三十手,执黑的AlphaGo都有几手棋在两可选项中,并没有选择自己推荐的那一项。这是因为AlphaGo的算法在前三十手引入了少许随机性。但执白的柯洁,每一手棋都与AlphaGo的推荐完全一致。是的,每一手棋。唯一不同的第30手斜拆三,AlphaGo教学工具经过评估后给出了更高的评价—— 白方胜率56.5%,相比AlphaGo推荐的着法,胜率额外增加了0.4个百分点!

更不可思议的是,右上角第九手开始的大型变化,在围棋史上是第一次出现。而柯洁的着法与AlphaGo的下法完全一致。换句话说,如果把执白的柯洁换成AlphaGo,棋局到第28手为止不会有任何区别。最强人类棋士和最强人工智能在棋盘上共同发现的这一变化,被命名为「AlphaGo – 柯洁定式」。

关于AlphaGo – 柯洁定式,其他围棋AI,如星阵、LeelaZero、KataGo等有不同意见,比如认为第30手白棋应该在P14长定型。但AlphaGo坚持认为柯洁是对的,此处白棋保留变化略好于定型。

第32手开始,柯洁的着法开始偏离AlphaGo的选择。不过,由于着法稳健,白方的胜率下跌不多。至第55手时,AlphaGo评估,白方胜率51%. 黑棋第55手碰,本身并不难对付。白棋只需连回一子,放黑棋二路渡过,专心经营中腹,仍可保持51%的胜率。

柯洁拒绝了这条四平八稳的大路,选择剑走偏锋。

这是计划的一部分。

5.

白棋第56手,左下角,碰。

从开局到现在,柯洁的胜率仅仅从53%变为51%,下降两个百分点。而56碰一手棋,AlphaGo评估白方的胜率就下降了九个百分点。在AlphaGo眼中,这是本局白方堕入深渊的起点。而在柯洁眼中,这步棋则是把局面导入预定轨道的良机。

白方这一着碰,好比金毛狮王的「七伤拳」,虽然先伤到自己,却令对手也不得脱身。AlphaGo在此处不能退缩,只能与柯洁近身搏斗。

第57手至106手,二十五个回合之后,棋盘上沧海桑田。黑棋、白棋圈注的九块棋子,漂浮在空中,都有受攻击的危险。九龙共舞,难得一见的奇景。

让局面更显混乱的,则是左下角A位价值近百目的大劫。早在AlphaGo与李世乭对战时,棋界就有传言「AlphaGo不会打劫」。虽然事后证实这是谣言,但劫争确实会占用人工智能的搜索深度,从而增加AI处理复杂局面的难度。而且,白方对于左下劫争的处理可采取「引而不发」的策略。这处劫争对于黑方好比一枚不定时炸弹,引爆的主动权在白方手里。

九龙共舞+天下大劫,柯洁成功将AlphaGo拖到了悬崖边。而柯洁付出的代价是,他比AlphaGo离悬崖更近一步。

6.

第106手,AlphaGo评估柯洁胜率29%. 在AlphaGo眼中,29%的胜率尚不能称绝望,但已离失败不远。而柯洁则沉浸在实现预定计划的兴奋中,在悬崖边上与AlphaGo杀红了眼,浑然不觉身后就是万丈深渊。

柯洁看到了棋局胜利的曙光,甚至听到了自己「砰砰」的心跳声。捂住胸口,稍微平复心情之后,柯洁坚定地落下第114手,断。

柯洁眼中的这局棋,已经进入了他的掌控之中。白棋将右边两条黑棋大龙切断之后,黑方难以两全。在此基础上,白方只需要一个合适的时机引爆左下劫争,即可走向胜利。

担任现场解说的古力九段,兴奋地宣称「或许今天能见证历史」。围棋人太需要一场胜利,在时代的滚滚车轮前赢得一些缓冲的时间。乐观的情绪由柯洁传递给古力,随后扩散到现场观众之间。几秒钟之后,收看网络直播的观众也受到感染,「柯洁胜利在望」一时成为热门网络社区议题。

人类虚幻的希望没能维持太久。 第119手冷酷的一并,AlphaGo击碎了人类最后的幻想。

此手同时窥视A位围歼白中央大龙、B位上下会师两处好点,必得其一。黑棋这一手,补全自身棋形的弱点,为接下来的发力创造了条件。这一着并,恰似拳击手缩回拳头蓄积力量,观察对手破绽再出拳,随即一击制胜。

目睹这着妙手之后,柯洁冷静了下来。棋盘上混战如旧,九龙共舞和天下大劫的格局未变。但AlphaGo似乎率先理清头绪,找到了通往胜利之门的钥匙。

短短几个回合,柯洁从天堂到地狱。或许他已经隐隐预感到失败的结局,但柯洁决定宁为玉碎,不为瓦全。第122手以下,柯洁拼着右下大龙死活不顾,强行冲出切断黑棋。随后的第128手,柯洁终于引爆了左下的百目大劫。

劫争的胜负,全在于劫材。而AlphaGo第133手找劫材的好手,凭空多出一枚劫材。黑方借此赢得劫争,锁定胜局。之后,柯洁草草抵抗了数回合,在第155手时投子认输。

7.

赛后总结复盘时,部分职业棋手认为柯洁曾有机会获胜。中国国家围棋队总教练俞斌九段更提出从棋局中间复盘与AlphaGo重下的设想,研究柯洁是否确实有胜机。

他们把柯洁本局的失败视作一种偶然,这在当时的状况下是合理的想法。毕竟,棋局的战斗极其眼花缭乱,而柯洁看上去一度距离胜利不远。

茨威格在【人类群星闪耀时】中,同样认为君士坦丁十一世最终的失败是偶然的。

在茨威格的故事里,八千君士坦丁堡守军在两个月内多次击退了奥斯曼十五万精锐的冲击,土耳其人几乎就要放弃。穆罕默德二世决心在5月29日发动最后一次总攻,这将决定罗马帝国的最后命运。

5月29日,筋疲力尽的罗马守军仍奋力击退苏丹近卫军的冲击。但一扇忘记关闭的小门决定了君士坦丁堡的失败。一小支苏丹近卫军意外发现,狄奥多西内墙的凯尔卡门竟敞开着。土耳其军队蜂拥涌入凯尔卡门,而罗马人再也没有可供抽调的预备队去堵上缺口。千年名城君士坦丁堡就此陷落,千年的罗马帝国最终亡于「征服者」穆罕默德二世之手。

一个芝麻绿豆般的意外,一扇遭人遗忘的凯尔卡门,竟然阴差阳错地成了改变世界历史的始作俑者。茨威格是这样写的,但罗马帝国的灭亡,当真是偶然吗?

即使罗马守军没有忘记关闭凯尔卡门,即使5月29日当天奥斯曼人的进攻再度被击退,不过只能为罗马帝国延长几天或几周的国祚而已。以穆罕默德二世之雄才大略、心狠手辣,即使围城战一时陷入僵局,君士坦丁所期望的奥斯曼内战恐怕一时也不会出现。

二十倍的军力差距,五十倍的领土面积差距,军事科技上的代差,奥斯曼人攻克君士坦丁堡只是时间问题。

与之相似,柯洁的失利并非因为一着棋的失误。即使再给柯洁机会,从第106手开始重新挑战AlphaGo,他也很难逆转乾坤。以事后诸葛亮的视角来看AlphaGo处理复杂对攻局面同样稳妥,几乎不会犯错。

8.

1453年君士坦丁堡之战的双方,没有明显的正义与邪恶之分。这既是君士坦丁十一世为了拯救垂暮的罗马帝国的最后努力,也是穆罕默德二世带领奥斯曼帝国崛起的重要一战。

君士坦丁代表旧时代,是罗马尚武精神的传承者、罗马荣耀最后的捍卫者。而穆罕默德代表崛起的新势力,凭借先进的科技与军事实力,征服旧帝国最后的堡垒。

柯洁在当时年仅二十岁,却主动承担起捍卫人类心智最后荣耀的重任。很多人赞美柯洁的勇气,不过如果世界第一不是柯洁,换成其他年轻棋士,也会做出同样的选择。这是千年棋士精神的传承。

君士坦丁十一世在罗马帝国的最后时刻英勇战死沙场,没有辱没他尊号里「奥古斯都」、「凯撒」两位罗马帝国创始人的威名。君士坦丁将奥斯曼拖入君士坦丁堡城下决战的计划,在战略上无懈可击。 可惜,在绝对的实力面前,再完美的战略,能争取到的至多是虚无缥缈的成功机会。

柯洁同样制定了漂亮的战略规划,并且在极端困难的情况下,成功推进规划的执行。在战术层面上,柯洁前半盘接近完美的布局,为悬崖边的决斗创造了条件。决斗开打之后,柯洁在前几十个回合也没有明显落入下风,甚至一度产生了胜利在望的错觉。

只是,实力的差距最终决定了一切。柯洁生在互联网时代,二十岁就经历数万盘实战对局的训练,已经超越大多数棋界前辈一生的对局数。然而,这与AlphaGo Master在两千多块GPU上的三千万盘对局相比,只是九牛一毛。天才少年的大脑结构再精巧,也敌不过每秒能运算1000万亿次的谷歌TPU.

柯洁做到了近乎完美,结局则是一场完美的失败。