恰恰相反,要下贏AI你需要專門的套路
ICLR正在審稿中的論文:Adversarial Policies Beat Professional-Level Go AIs
論文最初版用了一個不常用的圍棋規則(Tromp Taylor),由於KataGo訓練不是用的這個規則,對抗攻擊走到利用規則漏洞去了。
revision v1.2中修復了這個問題:
棋譜:
對抗攻擊的套路很深,全都是對殺中只差一氣的局面,此時KataGo只要收氣就贏了,讓會數氣的新手來下都行,他卻迷之不管,導致大龍全死。比如這盤
此時輪到KataGo的白棋下,白棋左上大龍只有兩氣,黑角上也是兩氣,中間被圍住的那團只有一氣。白棋不管提掉角上還是提掉中間都行,換做一個會數氣的新手來都贏了。但是KataGo就不,他下在外面一個無關的位置。雖然有個緊氣劫,但是黑棋萬劫不應。
至於這個結果是不是真的是KataGo下出來的,B站有up做了驗證
確實是一個有效的對抗攻擊