當前位置: 華文星空 > 體育

高曉松說 AlphaGo 下得沒有美感,不會打劫,事實如此嗎?

2017-06-03體育

即懂圍棋,又懂電腦演算法,人工智能,深度學習,的人非常少。

其實圍棋高手看到的圍棋,和電腦演算法中的圍棋,是不一樣的。

演算法主要的是透過過去的對弈數據(有的是人類的對弈,有的是人工智能和人工智能的對弈),擬合出來一個大概率演算法。

但這個演算法並不一定是最優解。

最優解是什麽?

最優解是無論概率多少小的情況下,都能找到它。如同破解密碼一樣,無論你的密碼位數有多長,我都能秒破,這就是最優解。

也就是說,最優解是和概率無關的,最優解永遠都能反你的最弱的那一點攻擊你。

而現在的圍棋人工智能,並不是最優解,是高概率擬合數據,這個高概率就是依靠過去數據來擬合,反應在人工智能分析上就是權重,也就是把後面可能會贏的位置標上更大的權重。

這個在未來如果能算出圍棋最優解時,也是有漏洞的,因為可能是最優解就是其中小概率中。

現在的電腦演算法,想要算出這種極小概率是非常困難的,需要極大量的數據擬合,這也是為什麽圍棋人工智能越來越強,而不是一開始出來時就很強的原因。

原因就是大量的過去數據擬合了了這種小概率,人類的算力不夠,才會導致人類在計算中更容易出錯。

在計算出圍棋最優解前,圍棋的人工智能只要不斷加對弈的盤數,來不斷擬合數據,就能一代勝過一代,但並不是最優解下法。

未來如果量子電腦,或芯片技術有了突飛猛進的進展,那麽未來很有可能算出最優解,這樣圍棋人工智能就不會再有任何進步了,也就是最優解是最終的下法,無論是人類,還是圍棋人工智能都只是逼近了這個最優解,但是不能完全達到最優解的程式(否則無論你加多少盤數據,你都無法提升圍棋人工智能的進步)。

不會打劫,可能是因為圍棋人工智能過去擬合數據的盤中,打劫次數出現的盤非常少,所以擬合出來的人工智能也是打劫少。

如果你給這個圍棋人工智能餵很多很多打劫數據的盤,這樣人工智能也會能擬合出很好的打劫。

或者說這是一種幸存者偏差,因為打劫在過去的局數中出現的概率極小,所以你很少看到人工智能打劫,這實際上是餵圍棋的人工智能數據出現的數據偏差,因為圍棋人工智能計算的是更多的是常用對局盤,而打劫在樣本空間中出現的概率少。

所以理論上,只要在餵人工智能訓練數據時,偏重於更多的打劫對弈盤,出來的人工智能就會非常善於打劫。

現在人工智能,因為在布局上會使用大概率下法,你在布局上贏不了,後面想靠打劫來算計人工智能基本上不可能。因為打劫不是一開始出現的,是中盤出現的,只要電腦完成了大概率布局,你再想用打劫來贏就不可能了,打劫的戰術勝利,並不能給你帶來翻盤。

所以人類想透過打劫來贏人工智能基本上不可能,因為圍棋生的就戰略布局,你前期就輸了,後期就很難跟上,因為圍棋人工智能是穩紮穩打的,不是有大的漏洞。

等到那天電腦算出了最優解,整個人工智能的漏洞也一樣會暴露出來,只是人的記憶和算力有限,沒有辦法和無限精力的電腦對抗,如同人和機器拼體力。

不過未來隨著算力的巨大進步,特別是量子電腦理論上可以實作算力指數增長,圍棋的優解,相信也會有求出來,現在的人工智能圍棋這種概率下法,你會發現漏洞極多,因為最優解可以在極小概率下翻盤。

人工智能對人工智能,未來是演算法競爭的比拼,這個也會刺激圍棋最優解的到來,也許算到那一天,圍棋人工智能之間的PK可能要就穩定在50%對50%之間,打平手時不能進步時,這時高概率演算法就不能取得優勢,只能期待最終的圍棋人工智能最優解演算法出來了。

最優解出來了,圍棋的整個研究也就到頭了,不過未來可以指數增長圍棋的子數,可以擴大10倍,100倍棋盤,100萬倍棋盤交叉點(這時基本上沒有人類什麽事了),再來相互比拼算力,這時新一代的人工智能又能出現。最後變成人工智能和人工智能的PK,演算法和演算法的競爭,整個過程對人類演算法,算力硬件的提升會有巨大幫助,對整個人類也是不斷受益