这个问题可以分为几个层次来理解。
第一、足够的数据不代表可以预测未来。即使是三体这样简单的问题,也是无法预测的;更不要说股价走势这种复杂的运动。关于三体问题(在太阳和地球的双重影响下,月球如何绕地球运动?),可以参考:
[三体问题」无解吗?为什么? - 量子位的回答 - 知乎
第二、细小的规律无法向上推导出上一层的规律,宏观与微观的性质是不一样的,More is different。比如我们是无法通过水分子的性质推断水的性质,水分子越多,单个水分子就越不重要。可以参考:
第三、很多数据是无法收集的,更不要说实时采集,或者说不是每一种信息都是可以量化的。比如人的风险厌恶水平和喜好倾向。即使是可采集的数据,也存在信噪比问题,数据中的信号更多的被淹没在噪音中,就像在沙漠中寻找一粒黄金;数据的另一个问题是数据与结果之间也许并没有什么关系,只是看上去似乎有关系而已。
第四、结果是不确定的,现实世界不是一个非黑即白的世界,更多的是一种模糊的状态,相同的事情在不同/相同条件下会出现不同的选择。或者说现实是一种博弈,一种权衡;而不是一个定论。
第五、机器学习目前仍停留在数据拟合阶段,并不能给出因果关系,AI在实践中面临着很多的困难。
本质上股价是无法预测的 ;目前的机器学习不可能预测,未来的机器学习也不可能。