人类棋手如柯洁是如何下围棋的？

2017-05-31体育

这是一个非常难的问题，如果能回答这个问题，那就能根据对人的理解，做出真正的人工智能了。

我既不懂强化学习也不懂围棋，但是这个问题挺有意思的。我大概从哪篇论文里面看到过大概的解释：在刚开局的时候，可能性太多了，你是算不过来的。但是根据经验，人们大概有感觉哪个地方价值高（也就是下那里容易赢），然后就根据定式下棋，这在强化学习里面叫model-free learning，就是你只记住棋盘不同位置或者不同模式下，哪个地方价值高。然后到了中盘，就开始算了，无论是人还是alphago，都会「硬背」一些中盘模式，根据这些对模式的理解进行推演计算来下子，这在强化学习里面叫model-based learning。