當前位置: 華文星空 > 體育

讓AlphaGo炒股結果會如何?

2017-07-19體育

目前實際意義上的神經網絡,AlphaGo本質上是在一個存在未來函數勝率反饋同時時序對應對手行為( 回合制 )的策略條件下統計所有可能環境下的策略優劣度並相關自身與對手策略的相對決定性選出最優解的過程。細節上會分解策略的步驟並量化策略的關聯性的對應效用(也就是透過 蒙地卡羅樹搜尋 擬合局面評估函數和策略函數、以及機器學習RL形成對數策略)。這個統計歸納成一個庫再透過一個對數據演算法輸出出來。

細節見 Nature的論文: http://www. nature.com/nature/journ al/v529/n7587/full/nature16961.html

AlphaGo其數據本身就是演算法。那我們下面就討論以神經網絡的學習演算法形成交易策略的可行性。

AlphaGo對於圍棋與股票市場的差異主要體現四方面:


一、資訊生成機制不同,股票市場中的動因條件是多層次且混沌的。圍棋的相互決定性只對於對手,而股票的相互決定性對於所有市場參與物件

二、對手與對手反饋機制不同,圍棋是回合制完全資訊非合作動態博弈,而股票市場是一對多完全資訊非合作靜態博弈

三、優劣度評估與局面評估函數的性質類似但方向不同,股票的最終評估物件是收益,而圍棋評估是勝率。且股票的局面有兩個層次,一是個股篩選,二是持倉後策略。兩者組合,就是在市場中不斷交換個股的最高勝率條件的持倉。如果將優劣評估設成以增輻一定偏離值內的符合度,亦或者是動態生成局面下一時序可能局面收益預測的權重,這兩者就是兩個獨立的優劣評估系統。

四、數據原型不同,圍棋只需處理對手數據和局面數據。股票有成交sick,有價格、成交方向數據,極難產生關聯條件。



有空,文末會聊一聊現行有效的「分型」理論過濾混沌資訊建立有效條件的套用性。

而對於股票市場時序對應行為(非回合制)的機制:

1.歷史參與者V行為構成市場資訊a

2.參與者ABuy觀測市場資訊產生交易動機,與參與者ASell發生交易,或ABuy產生

3.A交易影響市場價格,構成市場資訊b,使觀測者B產生交易動機

4.觀測者BBuy與BSell發生交易,構成市場資訊c

如果說V行為導致了A行為,連續產生了C行為。而V、A、C行為本身存在 相互決定性 的影響關聯就是一個由人類心理動態構成的混沌系統,是取決於完全不同的動機機制和策略機制而產生的不同頻率的固定方向行為(Buy與Sell)。如果以行為發生邏輯提取條件,那麽到了不同的數據環境,混沌系統又不同了,也就失靈了。

因為決定交易的,市場資訊只是誘因,動因是對於市場資訊的動機機制而產生的策略。這個混沌系統下,有效的資訊極其有限。大量的數據都是垃圾數據。


股票市場的優劣水平計算,是以收益為結果導向,而這種過程是受大量無法產生條件關聯的中間因素幹擾的。

從數據原型來講,如果不以對手行為為時序單位,按歷史市場資訊來分析

我曾經做過一個統計模型,一個4日的K線的開盤價、收盤價、最高價、最低價的增輻(Increase.)為參照陣列,以5%為允許偏離值。1990年至今3000余支股票的數據,僅檢測到1個匹配陣列。後放低標準,僅檢測開盤價,也檢測到不過6個匹配陣列。


AlphaGo本身的數據原型是回合制並只有一個反饋條件的,能夠形成數據關聯特征的數據以數百萬計。

而股票市場的反饋條件有多少個呢?不知道,這是與市場參與者動機的發生密度決定交易頻率而形成的,這個反饋條件也是一個指數級的數碼。

任何模型、策略、邏輯、演算法的基礎,基本邏輯都是構建在條件反射上的, 股票市場的復雜度以及無序性無法有效的提取關聯陣列條件(這也是為什麽會有原理不明但卻有效的分型理論以及「纏論」的成因)

AlphaGo的條件可能足夠多,但是是明確且相互對應的。

而股票市場的條件反饋如何構建?股票市場的復雜性已經證明了不能用明確條件來統計提取有效數據擬訂對數據策略。

而如果用一定允許偏離值來抓取數據特征關聯條件形成策略,上面的舉例已經證明這其中的偏差超出了有效的程度。並且,股票市場上,相同的陣列,產生的不同結果也是極其正常的,時序結果也是不同的。


以上