當前位置: 華文星空 > 知識

如何看待 Google 圍棋 AI AlphaGo 擊敗歐洲圍棋冠軍?

2016-03-15知識

-

「珍珠港遭到空襲!這不是演習!這不是演習!這不是演習!」

——2016年1月28日淩晨


-

從昨晚開始,一條聲稱谷歌AI在19路棋盤上分先戰勝樊麾二段,並且論文已登上Nature的訊息刷爆了朋友圈。

一開始,就像以往的那些「大新聞」一樣,大家都認為是標題黨,甚至某業余7段還查驗到其論文尚未被Nature稽核透過。

然而隨著時間的推移,越來越多的近距離詳細訊息傳來,開始有人相信訊息的真實性。

圍棋圈內的各種微信群、朋友圈都在不斷的爭論,相信的人越來越多,不信的人也堅持己見。


終於,在接近淩晨兩點,又一條最新報道來了,這次還附帶著棋譜:

面對谷歌圍棋AI,人類最後的智力驕傲即將崩塌……(雖是真訊息,但稍有標題黨之嫌)

至此,看到棋譜的所有人幾乎都相信了: 人工智慧AlphaGo,實作了裏程碑式的一步。


-

首先,在客觀上要肯定AlphaGo實作的水平進步。


從昨晚開始,一條聲稱某AI在19路棋盤上分先戰勝範麾二段,並且論文已登上Nature的訊息刷爆了朋友圈。

一開始,就像以往的那些「大新聞」一樣,大家都認為是標題黨,甚至某業余7段還查驗到其論文尚未被Nature稽核透過。

然而隨著時間的推移,越來越多的近距離詳細訊息傳來,開始有人相信訊息的真實性。

圍棋圈內的各種微信群、朋友圈都在不斷的爭論,相信的人越來越多,不信的人也堅持己見。


終於,在接近淩晨兩點,又一條最新報道來了,這次還附帶著棋譜。

以往最強的圍棋AI,大致是CrazyStone、Zen和銀星圍棋這幾個。

而AlphaGo在讓以上幾個程式(無銀星圍棋)4子的情況下,取得了80%左右的勝率。我們據此基本可以判斷, 人工智慧將自己的水平上限一下子提高了 5個子。


樊麾二段,雖然以歐洲冠軍聞名於世,但其實圈內誰都知道他是一名中國旅歐教學的職業棋手。

雖然遠離東亞職業一線,但樊老師的水平仍然是不容置疑的,他依然有著職業的水平(雖然是較弱的職業),一般的業6仍然是比他不上的。

AlphaGo在正式比賽中對樊老師5:0(棋譜已可見),據說加上非正式比賽的總分為8:2(已確認),再加上棋譜裏AlphaGo顯示出的驚人的表現,我們可以認為,人工智慧在圍棋上的水平已經邁入了職業的大門。

(最新:據多位頂尖棋手對棋譜的鑒定,認為AlphaGo的水平應該在業余強6段到弱職業之間,離人類頂尖大概還有一先到兩先的差距)

(對於西方圍棋包括樊老師的相關介紹,可見西方人的圍棋水平如何? - 高飛龍的回答)


說的更明白點,之前的AI在蒙地卡羅演算法的幫助下雖然取得了革命性的進步,戰勝了絕大多數的人類,但人類中能戰勝那些AI的人數可能仍然在近百萬的量級。

而自今日(其實已經是三個月前了)的AlphaGo起,能在圍棋盤上戰勝AI的人類人數可能已經不到千人了。


按照 @田淵棟 老師的說法,這個訊息在相關研究圈內應該早就不是新聞了。

甚至回想一下昨天祖克柏在facebook上突然發聲支持自己的研究團隊,也因為是知道了google團隊的成果即將在一日內公示,所以想要在輿論中搶占一個位置。

(田老師參與的facebook的研究團隊,是google現在最大的競爭對手,田老師他們使用的方法應該不太一樣,雖然他們暫時落後,但我同樣也很期待他們的下一步進展)


總之,這真的不是演習。


-

接下來談點個人對人工智慧的粗淺理解。

近些年來,盡管在蒙地卡羅演算法的幫助下,AI實作了革命性的進步,達到了能戰勝大部份人類的水平(中等業余5段),但隨著莫耳定律的走向終點(據某it界前輩指點,莫耳定律並非輿論所說的即將結束,而是轉換為了新的形式),電腦硬體的發展速度在舊有的道路上暫時無法按以前的速度繼續爆炸發展下去,大家都認為僅憑蒙地卡羅演算法是無法幫助AI戰勝人類的。


依據個人的理解,我曾在圍棋棋力業余低段位,如何繼續學習提高?有什麽推薦的參考書目和學習方法? - 高飛龍的回答中將圍棋的思維過程分解為四步的演進: 常識→棋感→計算→判斷


大約一年前,我曾和李喆六段就此問題進行過簡單討論,當時我認為蒙地卡羅演算法的成功主要在於為人工智慧建立了「棋感」,而以往的人工智慧只在「常識」和「計算」方面具有天然優勢。

在蒙地卡羅演算法之前,雖然電腦憑借強大的計算力可以積累大量「常識」,但由於「棋感」的缺失,人工智慧無法對計算方向進行有效的篩選,最終就不免淪於蠻力搜尋。

而蠻力搜尋雖然可以在一定程度上實作高水平的「計算」,甚至很多其他棋類都在這一環節上被人工智慧打敗,而由於圍棋的過度復雜和莫耳定律結束對電腦發展前景的限制,走到這一步仍然無法讓人工智慧戰勝人類。

(註:上圖為電腦眼中的西洋棋落子思路,而下圖為電腦眼中的圍棋落子思路,來自谷歌deepmind官網AlphaGo | Google DeepMind)


而蒙地卡羅演算法出現後,憑借大量儲備的棋局,透過勝負機率來判斷下一步著點以作為計算方向,極大的提高了計算的效率,所以AI的水平才實作了革命性的進步。


而這次的AlphaGo,使用了深度神經網路與蒙地卡羅樹狀搜尋相結合的方法。

依據已經能看到的Nature上的論文

http://www. nature.com/nature/journ al/v529/n7587/full/nature16961.html ,研究者們在AlphaGo中加入了兩個深度神經網路,以value networks來評估大量的選點,而以policy networks來選擇落子,並且開發了一種新式演算法來結合蒙地卡羅演算法和以上兩個神經網路。

(註:上圖為AlphaGo使用的神經網路結構示意圖,來自原論文)

在這種結合下,研究者們結合參考人類職業對局的監督式學習,和AI大量積累自對弈實作的深度學習,來訓練和提高AI的圍棋實力。


在蒙地卡羅演算法之後,我看到了新的天地。

這種結合以及新式的思路,讓人感到前景無限。


-

最後談一談,我認為我們應該保有的態度。


這裏,我首先想參照 李喆 六段在今天早上說的話:

「我們已來到兩個時代的連線處,無論你是否願意,這都是一個需要接受的事實。工具無善惡,善惡在人心。未來的路通往何方,將由我們自己決定。」

從淩晨到早上,朋友圈裏的評論區一直爭論不休,甚至某世界冠軍一直在說「不信」,畢竟大家在沒有看到板上的釘子之前,從情感上都是不願意相信的。

直到另外兩位一線棋手告訴他,已經可以看到棋譜了......


面對這個事件,接下來將會有很多的爆炸性新聞報道,以及各種各樣姿勢的討論。

我們要知道:

一.人工智慧的確實作了很大的進步。

這次的進步可能是革命性的,這次新聞宣稱的AI取得的成績並不是「標題黨」。


二. 人工智慧還沒有戰勝人類 (什麽所謂「人類最後的驕傲陷落」都屬於「標題黨」)。

但AI已經朝著這個方向邁出了一大步,而且是在很多人在蒙地卡羅之後不看好AI下一步發展的情況下,來了一個突然襲擊(谷歌從開始研究到出成果再到釋出,一直憋一個大新聞憋這麽久也真是能忍)。


三.人工智慧戰勝人類的時點,可能比很多人想象的要來的更早了。

不是之前設想的生物電腦或者量子電腦出現後,甚至都不是新材料制成的處理器取代矽晶片之後,而是在這個時代就有可能出現了。也許是五十年後,也許是二十年後,甚至可能是十年後。


從小學時開始,我就癡迷於許峰雄教授對於電腦西洋棋計畫的研究和成就,一直追蹤到97年「深藍」戰勝卡斯巴羅夫。(就是在那之後不久,我才從西洋棋轉投了圍棋......)

(註:上圖為第一個打敗人類的電腦西洋棋程式「深藍」之父——許峰雄)


從中學時代到大學時代,我一直追尋著許教授的動態和他撰寫的各種文章、書籍,他寫的【「深藍」揭秘】(「深藍」揭秘 (豆瓣))被我翻的都爛了,我甚至在中學時代一直想以此作為未來的求學從研的方向。

許教授離開IBM、前往亞研院並聲稱準備致力於作為最終問題的電腦圍棋難題之後,我仍然一年年心心念念的期待著許教授的後續動作。


然而十多年過去,等來的卻是無數的後來者。

這也挺好,人類就是不缺後來者。


看許教授對當年研究過程的講述,最大的感受就是:

其實並不是電腦打敗了人類,而是人類打敗了人類。


大量的電腦專家,配合大量的西洋棋職業棋手,在演算法上不斷革新,再搭乘上莫耳定律的東風,不斷的失敗再重來、輸了再修正,最終才解決了電腦西洋棋難題。

卡斯巴羅夫,是敗給了數以百計的人類專家的智慧的合力。


圍棋也會是一樣,電腦——今天說人工智慧更合適,戰勝人類的那一天遲早會來,大部份人都從來不否認這一點。

爭論,始終在於這一天的早晚。


而棋手和圍棋從業者們,出於可以理解的感情,總是希望並認為這一天不會來的那麽快,但他們絕對不會拒絕甚至仇視這種進步。

其實我看到的很多人,都一直期待並贊許著人工智慧的進步,甚至很多職業高手還親身參與和幫助著電腦圍棋計畫的研究。


我們努力打造著一個「大玩具」,一個能戰勝自己的「大玩具」。

所以最終的成功,是我們人類自己的成功,而不應該對電腦感到恐懼。


同時,這「大玩具」也不只是好玩而已,人工智慧對於現代乃至未來科技的發展有著極大的意義,這意義甚至會超出當年原子彈研究的後續紅利。


所以不要害怕,不要煩惱,讓我們期待著人工智慧在圍棋上戰勝人類的那一天的到來吧。

我之前一直認為在我有生之年是看不到這一天的,然而現在看來,我錯了。

我一點也不失望,反而感到很興奮,很激動,並且期待著以google和facebook為首的前沿研究團隊們的進一步的表現。


最後的最後,恭喜谷歌,恭喜圍棋,恭喜人類。


-