高曉松說 AlphaGo 下得沒有美感，不會打劫，事實如此嗎？

2017-06-03體育

即懂圍棋，又懂電腦演算法，人工智能，深度學習，的人非常少。

其實圍棋高手看到的圍棋，和電腦演算法中的圍棋，是不一樣的。

演算法主要的是透過過去的對弈數據（有的是人類的對弈，有的是人工智能和人工智能的對弈），擬合出來一個大概率演算法。

但這個演算法並不一定是最優解。

最優解是什麽？

最優解是無論概率多少小的情況下，都能找到它。如同破解密碼一樣，無論你的密碼位數有多長，我都能秒破，這就是最優解。

也就是說，最優解是和概率無關的，最優解永遠都能反你的最弱的那一點攻擊你。

而現在的圍棋人工智能，並不是最優解，是高概率擬合數據，這個高概率就是依靠過去數據來擬合，反應在人工智能分析上就是權重，也就是把後面可能會贏的位置標上更大的權重。

這個在未來如果能算出圍棋最優解時，也是有漏洞的，因為可能是最優解就是其中小概率中。

現在的電腦演算法，想要算出這種極小概率是非常困難的，需要極大量的數據擬合，這也是為什麽圍棋人工智能越來越強，而不是一開始出來時就很強的原因。

原因就是大量的過去數據擬合了了這種小概率，人類的算力不夠，才會導致人類在計算中更容易出錯。

在計算出圍棋最優解前，圍棋的人工智能只要不斷加對弈的盤數，來不斷擬合數據，就能一代勝過一代，但並不是最優解下法。

未來如果量子電腦，或芯片技術有了突飛猛進的進展，那麽未來很有可能算出最優解，這樣圍棋人工智能就不會再有任何進步了，也就是最優解是最終的下法，無論是人類，還是圍棋人工智能都只是逼近了這個最優解，但是不能完全達到最優解的程式（否則無論你加多少盤數據，你都無法提升圍棋人工智能的進步）。

不會打劫，可能是因為圍棋人工智能過去擬合數據的盤中，打劫次數出現的盤非常少，所以擬合出來的人工智能也是打劫少。

如果你給這個圍棋人工智能餵很多很多打劫數據的盤，這樣人工智能也會能擬合出很好的打劫。

或者說這是一種幸存者偏差，因為打劫在過去的局數中出現的概率極小，所以你很少看到人工智能打劫，這實際上是餵圍棋的人工智能數據出現的數據偏差，因為圍棋人工智能計算的是更多的是常用對局盤，而打劫在樣本空間中出現的概率少。

所以理論上，只要在餵人工智能訓練數據時，偏重於更多的打劫對弈盤，出來的人工智能就會非常善於打劫。

現在人工智能，因為在布局上會使用大概率下法，你在布局上贏不了，後面想靠打劫來算計人工智能基本上不可能。因為打劫不是一開始出現的，是中盤出現的，只要電腦完成了大概率布局，你再想用打劫來贏就不可能了，打劫的戰術勝利，並不能給你帶來翻盤。

所以人類想透過打劫來贏人工智能基本上不可能，因為圍棋生的就戰略布局，你前期就輸了，後期就很難跟上，因為圍棋人工智能是穩紮穩打的，不是有大的漏洞。

等到那天電腦算出了最優解，整個人工智能的漏洞也一樣會暴露出來，只是人的記憶和算力有限，沒有辦法和無限精力的電腦對抗，如同人和機器拼體力。

不過未來隨著算力的巨大進步，特別是量子電腦理論上可以實作算力指數增長，圍棋的優解，相信也會有求出來，現在的人工智能圍棋這種概率下法，你會發現漏洞極多，因為最優解可以在極小概率下翻盤。

人工智能對人工智能，未來是演算法競爭的比拼，這個也會刺激圍棋最優解的到來，也許算到那一天，圍棋人工智能之間的PK可能要就穩定在50%對50%之間，打平手時不能進步時，這時高概率演算法就不能取得優勢，只能期待最終的圍棋人工智能最優解演算法出來了。

最優解出來了，圍棋的整個研究也就到頭了，不過未來可以指數增長圍棋的子數，可以擴大10倍，100倍棋盤，100萬倍棋盤交叉點（這時基本上沒有人類什麽事了），再來相互比拼算力，這時新一代的人工智能又能出現。最後變成人工智能和人工智能的PK,演算法和演算法的競爭，整個過程對人類演算法，算力硬件的提升會有巨大幫助，對整個人類也是不斷受益