如果發明一種機器學習難以戰勝人類的棋類規則，這種規則應該具備什麽樣的特點？

2022-06-09體育

如果題目中的棋類指的是比較狹義的棋類遊戲，比如說圍棋、中國象棋和西洋棋這種規則嚴謹、隨機性低的抽象棋，那人類想獲勝可能就比較難了。

但如果我們擴大一下棋類遊戲的範疇的話，人類還是有一些希望的，就比如說——

想讓 AI 失利最簡單的辦法， 拉大遊戲裏的隨機性 ，就比如用飛行棋這種基本上全靠骰運的棋類，或者再簡化一萬倍，AI 和人類對著扔骰子，誰的點數大誰就獲勝。不過這種方式的弊端也很明顯，它只是將雙方的勝率強行拉成了五十五十，AI 的確難以獲勝了，但對面的人類同樣難以獲勝。

還有一種比較取巧的方法就是， 用那種很容易掌握必勝手段的棋類作為比拼手段 ，比如說井字棋，先手只要不亂來就很難輸，或者還有不設禁手的五子棋，先手只要稍微背一下棋譜就也能輕易取勝。玩這種遊戲的時候，只要讓人類先手就行了。這種方式的弊端在於……它完全就是在欺負人，不對，完全就是在欺負機器，畢竟玩這種先手必勝的棋類，不如直接定規則讓人類獲勝就好了。

既然說到欺負機器的方法，那我這裏不妨再提供一種思路，就是 找一個根本沒有訓練數據的棋類 ，比如說我自己在中學時候發明過一種填數棋，這種遊戲只有我跟我的幾個小夥伴玩過，根本沒有任何可考的對局數據，在這種情況下，用傳統的方式訓練 AI 就成了癡人說夢，那設計 AI 的時候就只能用一些簡單的基於規則的演算法，而如果讓我對戰這種 AI 的話，勝算還是比較高的。這種方式的弊端也很明顯，沒有訓練數據只是一時的事，隨著大家玩這種棋類遊戲的數量越來越多，數據的積累只是早晚的事罷了，拖得了一時也拖不了一世。

最後還有一種最為離譜的辦法，就是 把一些和棋類無關的要素強行引入到規則裏 ，比如說雙方落子之前需要先跟裁判聊天，裁判覺得跟誰聊天更順暢誰才能順利落子；或者更絕地，給雙方各發一套高考試卷，誰完成的情況好誰才能落子，AI 要想順利完成試卷，少說需要 OCR、自然語言理解和生成、相當大的知識庫儲備、常識理解的能力等等，以目前的技術應該離實作這些還有相當的距離。