當前位置: 華文星空 > 體育

如果發明一種機器學習難以戰勝人類的棋類規則,這種規則應該具備什麽樣的特點?

2022-06-09體育

如果題目中的棋類指的是比較狹義的棋類遊戲,比如說圍棋、中國象棋和西洋棋這種規則嚴謹、隨機性低的抽象棋,那人類想獲勝可能就比較難了。

但如果我們擴大一下棋類遊戲的範疇的話,人類還是有一些希望的,就比如說——

想讓 AI 失利最簡單的辦法, 拉大遊戲裏的隨機性 ,就比如用飛行棋這種基本上全靠骰運的棋類,或者再簡化一萬倍,AI 和人類對著扔骰子,誰的點數大誰就獲勝。不過這種方式的弊端也很明顯,它只是將雙方的勝率強行拉成了五十五十,AI 的確難以獲勝了,但對面的人類同樣難以獲勝。

還有一種比較取巧的方法就是, 用那種很容易掌握必勝手段的棋類作為比拼手段 ,比如說井字棋,先手只要不亂來就很難輸,或者還有不設禁手的五子棋,先手只要稍微背一下棋譜就也能輕易取勝。玩這種遊戲的時候,只要讓人類先手就行了。這種方式的弊端在於……它完全就是在欺負人,不對,完全就是在欺負機器,畢竟玩這種先手必勝的棋類,不如直接定規則讓人類獲勝就好了。

既然說到欺負機器的方法,那我這裏不妨再提供一種思路,就是 找一個根本沒有訓練數據的棋類 ,比如說我自己在中學時候發明過一種填數棋,這種遊戲只有我跟我的幾個小夥伴玩過,根本沒有任何可考的對局數據,在這種情況下,用傳統的方式訓練 AI 就成了癡人說夢,那設計 AI 的時候就只能用一些簡單的基於規則的演算法,而如果讓我對戰這種 AI 的話,勝算還是比較高的。這種方式的弊端也很明顯,沒有訓練數據只是一時的事,隨著大家玩這種棋類遊戲的數量越來越多,數據的積累只是早晚的事罷了,拖得了一時也拖不了一世。

最後還有一種最為離譜的辦法,就是 把一些和棋類無關的要素強行引入到規則裏 ,比如說雙方落子之前需要先跟裁判聊天,裁判覺得跟誰聊天更順暢誰才能順利落子;或者更絕地,給雙方各發一套高考試卷,誰完成的情況好誰才能落子,AI 要想順利完成試卷,少說需要 OCR、自然語言理解和生成、相當大的知識庫儲備、常識理解的能力等等,以目前的技術應該離實作這些還有相當的距離。