首先谢邀,本来我其实想忽略这个邀请的,因为我这个坑感觉实在太大了。但看见了子曰发的XUEMINGNANQING老师的答案,感觉写的非常好,并且极大地降低了回答难度(毕竟只用写
2008-2015,而本人恰恰也是2008年第一次听说了这个游戏)。那之后的那段本人不才,试图续写一下吧。希望不是狗尾续貂。
这里必须感叹一下,XUEMINGNANQING老师虽然一直有所耳闻,但从来没有拜读过他的作品,这篇文章看完,不禁佩服他在07年左右就有的深入见解,尤其是对于「所有游戏风格的统一」的论断。
以下是正文:
首先,所谓技术的变化,我认为,你得先知道什么是技术,以及什么是当前时代最前沿的技术,才能回答这个问题。可以说,这对于我这条试图回答这个问题的鱼来说,提出了一个巨大的挑战。因此,我认为,所有站在一个局外人的角度试图评价技术发展的努力,注定都是会失败的,因为除非你是世界顶尖水平,否则你怎么能评价别人的技术怎么样?举个例子来说,比如对于围棋来说,我相信对于所有非职业而言,我们认为比如李昌镐水平,在某一时刻,在曹薰铉之上,往往都是通过该时刻前历史战绩的比较,这是因为我们根本不知道他们到底脑子里在想什么,从而压根无从从技术层面评价。同样地,对于德州扑克这个结果有着巨大波动的游戏,如果不至少接近世界顶尖水平,进行所谓的评价估计只能贻笑大方,因为显然连结果都无法成为评价的有力依据。因此,我觉得比较好的形式,更多地是从我个人出发来探讨我所感受到的德州扑克技术的演变,因为让我说评价比如durrrr,urnotindangr2,isildur1,nutsinho这些人和诸如wcg|rider, mrgr33n13, forhayley, luvthewnba这些人到底在今天差在哪,我实在是不敢说一句话。因为前述,视角非常受局限,因此肯定有很多值得商讨的地方,还希望各位海涵。
个人认为,如果将德州扑克技术的演变划分为几个时期的话,The Mathematics of Poker (B. Chen, J. Ankenman, 2006) 的出版标志着德州扑克进入了当代,而在此之前还都是古代。为什么这么说呢?因为在这本书出版之前,世界上缺乏一个理论体系来评价到底怎样打牌是正确的这件事。举个例子,我们翻牌前在大盲位,有20个大盲注,按钮位加注3个大盲注,我们到底什么牌平跟,什么牌加注全压?这个问题在这本书提出之前,据我所知没有人能够用一个理论体系来解决。大家的想法经常都是:「他肯定没啥牌,我要ALLIN」或者「他在勾引我ALLIN,我要FOLD」。然而,这本书通过大量数学上的游戏模型,给出了寻找解的方法,并且一下子给出了寻找最大化压榨和所谓GTO(博弈论最优)这两种策略的具体方法。我不是说这本书之前,没有人想到过(或者执行过)这样的策略,而是说在这本书之前,我们凡人缺乏系统地学习和理解德州扑克的工具,而这本书提供了这样一个机会。
在这本书面世前的古代,毫无疑问人们都是通过一些无法量化的所谓直觉玩牌的,于是出现了很多对于风格的定义和争执,比如什么是TAG,LAG等等。但在这本书面世之后,由于思考问题的模型被(虽然比较粗糙)地介绍给了所有和你我一样的凡人,德州扑克技术层面从百家争鸣变成了一家独大,因为再也没有那么多种不同的(可能正确的)风格了。
为什么这么说呢?你肯定会问。这其实很简单,Mathematics of Poker的思想简要概括,就是他提供了一个模型,当我们输入参数(对手的范围和倾向)之后,我们可以得到输出(最大化压榨范围)。当我们不输入参数,而是假定对手可以执行GTO策略(事实上这也是一种参数),那么我们还是可以得到输出(GTO范围)。换言之,我们只要能够对对手进行估计,那么我们至少能够在多项式时间下找到最优解。至于为什么这些模型是对的?因为德州扑克相对这世界上的很多其他东西,复杂性(相对)实在是不够高,当我们能够从一些(虽然较多的)假设出发,利用比如CardrunnerEV这样的软件,完全可以简单穷尽整个决策树的。
但是,毕竟打牌这件事上,上面的模型有两个问题。第一,你到底怎么知道敌人的范围?第二,现场怎么可能让你穷尽决策树?
这里我们引用一些统计学的概念。由于上文所述,The Mathematics of Poker证明了给定所有公开信息下,最优策略的存在性和唯一性。于是事实上我们所有人在做的,就是试图估计这个最优策略。这个估计涉及两部分,第一部分我们需要先估计模型的输入参数,第二部分我们再试图估计模型的输出参数。但凡是估计,总会有误差,误差就是我们的估计与全知全能状态下模型的输出值的差了。于是这样就很容易理解了,我们的确解决不了上述两个问题,但通过努力、学习、复盘、观察、思考、理论模型、讨论、请教练、打牌、睡觉等等等等,我们可以尽可能试图缩小误差。误差的存在并不能证伪模型的正确性,这就如同现代经济学一样,每一个伟大的模型都伴随着无数的假设,这些假设比德州扑克里的模型还难满足,那些模型的输入条件比我们平时打的牌所遇到的情况更理想化,但你很难去怀疑这些模型结论的正确性和其相应的(至少是宏观上的)价值,这也就是逻辑的价值所在了。
更何况由于上文所述,最优策略是存在且唯一的。这也导致我们对输入参数的估计变简单了,毕竟假设对手是一年前的你,你估计他怎么想会很难吗?而如果对手跟你路数完全不一样,那他本身就已经让渡了EV,于是你也可以接受对他估计的更大误差了。
于是2008年之后德州扑克技术的变化,在我看来就是:
1. The Mathematics of Poker所给出的思考模型逐渐扩散
2. 使用上述思考模型的选手的估计误差普遍逐渐缩小
3. 由于普遍水平迅速提高,导致世界级必须在细节(误差的细小差距)上精益求精
这也直接导致了,我文章开头所引用的XUEMINGNANQING老师所说的,「所有游戏风格的统一」。因为事实上只有一个正确打法,就是模型所给出的数学最优,其他打法都是错的。在这里,所谓TAG LAG变得毫无意义,他们都是虚妄而华丽的假象,因为当时刻的最优可能要求你玩100%,也可能要求你玩5%,你必须能够一会玩100%,一会玩5%。事实上,世界最顶尖也是这么做的,我们可以回想,2008年左右的世界顶尖,普遍认为是durrrr,phil ivey,patrik antonius。在这之后,isildur1横空出世击沉durrrr,又被brian "sbrugby" townsend,cole "cts687" south以及brian "stinger88" hastings组团消灭,之后便再也没有如同durrrr这样风格明显的玩家出现了。无论是后面的scott "urnotindangr2" palmer,richard "nutsinho" lyndaker,issac "luvthewnba" haxton,ben "bttech86" tollerene,ben 「sauce123" sulsky,乃至phil "OMGclayaiken" galfond,doug "wcg|rider" polk,jacob "lottenice" rasmussen和不知道真名的forhayley,你能说出来这些人风格的普遍区别所在吗?这是因为他们的模型相同,并且差距体现在估计误差的细小差异上,乃至在我们凡人看来,我们无法如同当时看durrrr一样,发现他们和别人哪里做的不一样。但举个例子,我问你stu ungar和johnny chan风格有什么区别,我相信这问题看过他们资料的人根本不难回答。
在锦标赛的世界里,也是如此,calvin "cal42688" anderson 可以在scoop里3圈不入池,也可以三圈open80%的牌,这真的是他拿到了大牌吗?还是不同的时刻要求不同的最优策略?mtt世界里上文所述的世界顶尖策略的接近性也同样存在,这里就不再列举了。
具体来说,从我的直感来看,当代德州扑克对于前文所述的模型们的研究,正在朝着极为精密的方向发展。什么时候应该分割范围?什么时候HU里 LIMP BTN?MTT里前期到底应该多少X OPEN?我们什么FLOP CBET 2/3pot,什么FLOP CBET 1/2pot?这些问题你可能觉得很难得到精确的答案,但事实上这些问题是有答案的,并且答案都非常精密,可能精密到涵盖所有FLOP组合的一张大表的程度。世界顶级不是在家睡觉亦或者凭感觉打牌亦或者在网上与人进行无法量化的似是而非的感性的讨论而成为世界顶级的,因为寻找答案的方向都摆明了,愿不愿意顺着前人的足迹去试图理解,领悟,得到可复制的结论,就看每个人自己了。
上述也就是为什么德州扑克越来越难。现在在PS上小级别比赛,亦或者小-中级别现金,无数的REG明显也在用类似的思想进行游戏。这并不是说不沿着这方向努力赢不了,而是说会加大赢的困难程度,因为德州扑克毕竟存在很大的波动,并且不沿着这方面努力并不代表你不能执行一个让渡EV并不是特别多的策略。
至于未来,个人认为发展趋势会继续朝着现在的方向前进。我们会越来越多地看到年轻的网络大神们,从最开始就沿着最正确的方式学习而出来收割他们努力的成果。世界最顶尖的水平会越来越高,越发地让人高山仰止,而目前德州扑克的金字塔模型能否成立,我们这些凡人想在扑克世界里生存能否成功,就只能看新的玩家加入的速度了。
以上纯属个人观点。这篇文章写了一个小时,内容也比之前预想的写的要多。回过头来看似乎感觉非常枯燥,这类文章按理说应该是讲故事最有可读性(我感觉知乎高赞类答案好像都是围着题主的原问题讲了一些什么都没说的有趣故事)。可没办法,笔者不才,实在是搞不太明白世界最顶尖们脑袋里到底咋想的,因此也讲不来他们的故事,只能让各位凑合看了。。