目前实际意义上的神经网络,AlphaGo本质上是在一个存在未来函数胜率反馈同时时序对应对手行为( 回合制 )的策略条件下统计所有可能环境下的策略优劣度并相关自身与对手策略的相对决定性选出最优解的过程。细节上会分解策略的步骤并量化策略的关联性的对应效用(也就是通过 蒙特卡洛树搜索 拟合局面评估函数和策略函数、以及机器学习RL形成对数策略)。这个统计归纳成一个库再通过一个对数据算法输出出来。
细节见 Nature的论文: http://www. nature.com/nature/journ al/v529/n7587/full/nature16961.html
AlphaGo其数据本身就是算法。那我们下面就讨论以神经网络的学习算法形成交易策略的可行性。
AlphaGo对于围棋与股票市场的差异主要体现四方面:
一、信息生成机制不同,股票市场中的动因条件是多层次且混沌的。围棋的相互决定性只对于对手,而股票的相互决定性对于所有市场参与对象
二、对手与对手反馈机制不同,围棋是回合制完全信息非合作动态博弈,而股票市场是一对多完全信息非合作静态博弈
三、优劣度评估与局面评估函数的性质类似但方向不同,股票的最终评估对象是收益,而围棋评估是胜率。且股票的局面有两个层次,一是个股筛选,二是持仓后策略。两者组合,就是在市场中不断交换个股的最高胜率条件的持仓。如果将优劣评估设成以增辐一定偏离值内的符合度,亦或者是动态生成局面下一时序可能局面收益预测的权重,这两者就是两个独立的优劣评估系统。
四、数据原型不同,围棋只需处理对手数据和局面数据。股票有成交sick,有价格、成交方向数据,极难产生关联条件。
有空,文末会聊一聊现行有效的「分型」理论过滤混沌信息建立有效条件的应用性。
而对于股票市场时序对应行为(非回合制)的机制:
1.历史参与者V行为构成市场信息a
2.参与者ABuy观测市场信息产生交易动机,与参与者ASell发生交易,或ABuy产生
3.A交易影响市场价格,构成市场信息b,使观测者B产生交易动机
4.观测者BBuy与BSell发生交易,构成市场信息c
如果说V行为导致了A行为,连续产生了C行为。而V、A、C行为本身存在 相互决定性 的影响关联就是一个由人类心理动态构成的混沌系统,是取决于完全不同的动机机制和策略机制而产生的不同频率的固定方向行为(Buy与Sell)。如果以行为发生逻辑提取条件,那么到了不同的数据环境,混沌系统又不同了,也就失灵了。
因为决定交易的,市场信息只是诱因,动因是对于市场信息的动机机制而产生的策略。这个混沌系统下,有效的信息极其有限。大量的数据都是垃圾数据。
股票市场的优劣水平计算,是以收益为结果导向,而这种过程是受大量无法产生条件关联的中间因素干扰的。
从数据原型来讲,如果不以对手行为为时序单位,按历史市场信息来分析 :
我曾经做过一个统计模型,一个4日的K线的开盘价、收盘价、最高价、最低价的增辐(Increase.)为参照数组,以5%为允许偏离值。1990年至今3000余支股票的数据,仅检测到1个匹配数组。后放低标准,仅检测开盘价,也检测到不过6个匹配数组。
AlphaGo本身的数据原型是回合制并只有一个反馈条件的,能够形成数据关联特征的数据以数百万计。
而股票市场的反馈条件有多少个呢?不知道,这是与市场参与者动机的发生密度决定交易频率而形成的,这个反馈条件也是一个指数级的数字。
任何模型、策略、逻辑、算法的基础,基本逻辑都是构建在条件反射上的, 股票市场的复杂度以及无序性无法有效的提取关联数组条件(这也是为什么会有原理不明但却有效的分型理论以及「缠论」的成因) :
AlphaGo的条件可能足够多,但是是明确且相互对应的。
而股票市场的条件反馈如何构建?股票市场的复杂性已经证明了不能用明确条件来统计提取有效数据拟订对数据策略。
而如果用一定允许偏离值来抓取数据特征关联条件形成策略,上面的举例已经证明这其中的偏差超出了有效的程度。并且,股票市场上,相同的数组,产生的不同结果也是极其正常的,时序结果也是不同的。
以上