如果发明一种机器学习难以战胜人类的棋类规则，这种规则应该具备什么样的特点？

2022-06-09体育

其他人说的随机性强等特点根本难不倒AI，只要有一个可学习的有明确数学定义的效用函数（i.e. 奖励函数，价值函数，损失函数或适应度函数），甚至有时候根本不需要机器学习，只用各种求解器（Gurobi，Z3-solver，反向传播优化器等）就可以直接找到比人类手算强的多的近似解

什么样的游戏能难倒AI呢？当然是那些效用函数很难定义，就算定义好了也很难在各种搜索算法中找到一个解使效用函数不为0的游戏（稀疏奖励问题）

比如说推翻数学猜想或给程序找bug，如果你让AI去推翻一个著名的数学猜想（比如黎曼猜想）或给一个时间复杂度巨高的屎山代码找bug，你会发现：

有时候你连效用函数都不知道怎么定义（比如数学猜想之前还没发现过反例，或者不知道什么样的程序才算好程序）

就算定义了效用函数，有时候因为复杂度过高，甚至根本没法对它进行求值（比如运行一次屎山程序需要几天才能跑完，这样效用函数求值一次就要花几天）

就算定义了效用函数也刚好能求值，由于AI的搜索空间过大导致效用一直为0（比如说生成的例子全都符合黎曼猜想，或者程序一直没出bug），这样AI就等于一直什么也没学到，自然也不知道怎么改进策略