当前位置: 华文星空 > 体育

人类棋手如柯洁是如何下围棋的?

2017-05-31体育

这是一个非常难的问题,如果能回答这个问题,那就能根据对人的理解,做出真正的人工智能了。

我既不懂强化学习也不懂围棋,但是这个问题挺有意思的。我大概从哪篇论文里面看到过大概的解释:在刚开局的时候,可能性太多了,你是算不过来的。但是根据经验,人们大概有感觉哪个地方价值高(也就是下那里容易赢),然后就根据定式下棋,这在强化学习里面叫model-free learning,就是你只记住棋盘不同位置或者不同模式下,哪个地方价值高。然后到了中盘,就开始算了,无论是人还是alphago,都会「硬背」一些中盘模式,根据这些对模式的理解进行推演计算来下子,这在强化学习里面叫model-based learning。

围棋分析量太大了,我好像是在CCN2020里面,Weiji Ma讲了一些研究人类玩四子棋的工作。点击以下链接,从47分多点开始。

我个人感觉人类智力能在如此低功率下做出这么好的逼近,这种能力主要来源于偏见,可以从这些偏见中理解一下人怎么做的。