其他人说的随机性强等特点根本难不倒AI,只要有一个可学习的有明确数学定义的效用函数(i.e. 奖励函数,价值函数,损失函数或适应度函数),甚至有时候根本不需要机器学习,只用各种求解器(Gurobi,Z3-solver,反向传播优化器等)就可以直接找到比人类手算强的多的近似解
什么样的游戏能难倒AI呢?当然是那些效用函数很难定义,就算定义好了也很难在各种搜索算法中找到一个解使效用函数不为0的游戏(稀疏奖励问题)
比如说推翻数学猜想或给程序找bug,如果你让AI去推翻一个著名的数学猜想(比如黎曼猜想)或给一个时间复杂度巨高的屎山代码找bug,你会发现:
有时候你连效用函数都不知道怎么定义(比如数学猜想之前还没发现过反例,或者不知道什么样的程序才算好程序)
就算定义了效用函数,有时候因为复杂度过高,甚至根本没法对它进行求值(比如运行一次屎山程序需要几天才能跑完,这样效用函数求值一次就要花几天)
就算定义了效用函数也刚好能求值,由于AI的搜索空间过大导致效用一直为0(比如说生成的例子全都符合黎曼猜想,或者程序一直没出bug),这样AI就等于一直什么也没学到,自然也不知道怎么改进策略