電子信箱 service [at] bituzi.com
幣圖誌首頁 facebook粉絲團 google plus google plus


當金融交易遇上資料科學!


近年來資料科學興起,大家都在談論Big Data。在這股浪潮下,金融交易也不例外。交易者不僅容易取得市場資料,要回測歷史數據,甚至對未來進行自動化交易(演算法交易、程式交易),都是相當容易的一件事。究竟巨量資料時代的來臨,金融交易是否也跟著產生巨大改變? 本文我們探討金融交易遇上資料科學的變與不變。
(附註:本文節錄前面幾篇文章的部分內容)

過去嘴上股神,現在資料說話

老一輩喜愛金融交易的朋友,往往花很多時間在研究各種技術分析、K線型態、價量指標…等,無非是想要準確預測明天股市行情,是漲是跌雖然只有兩種可能,可惜卻沒有人能夠保證。而交易的目的在獲利,投資人除了關心每次輸贏外,賺賠多少也是關鍵因素。就一個資料工作者而言,我們不知道明天是漲是跌,但我們可以計算出過去漲跌的機率分佈。舉例來說,長紅棒代表多頭氣勢如紅,收盤價遠大於開盤價,因此預期未來行情會繼續漲;反之長黑棒是收盤價遠低於開盤價,預期行情會繼續跌。然而真是如此嗎? 我們實際回測歷史數據如下,統計時間為2007年01月至2016年06月。

下圖為長紅棒出現,3天後的漲跌幅分佈。這裡我們定義的長紅棒為收盤價高於開盤價1%以上。同理,右圖為長黑棒出現後,3天後的漲跌機率分佈。
根據統計,約有59.40%的機率在長紅棒出現後,3天後的收盤價會更高,漲跌幅的平均值為0.177%;同理,長黑棒定義方式為收盤價小於開盤價1%以上。長黑棒出現後,約只有46.22%的機率3天後收盤價會更低,但漲跌幅的平均值竟然仍為正數0.1854%。
由此看來,台股從2007年01月至2016年05月,歷經過空頭與多頭市場,但長紅棒似乎較具有指標意義,勝率高達近60%;而長黑棒的平均漲跌幅仍為正數的結果,代表未來三日行情不一定會往下發展。有趣的是,這樣的統計結果,漲跌幅的期望值與0相當接近,與一般認知K線型態所傳達”預測”並不相同。

大家都在談勝率,但這卻是個假議題

上面例子道出了資料分析在金融交易的『真實性』。然而,只要讓資料說出『正確的話』,交易就萬無一失,投資就一片光明嗎? 若是如此你就太小看這個『邪惡的市場』了,多少英雄好漢正是死在這樣的錯誤觀念之下。過去的金融市場,流傳著各種跟神一樣的技術分析大師,只要看對一次行情就造神成功,看錯了就選擇性忘記,反正時間會沖淡一切。現在的市場,數據會說話,任何策略或指標都可立即回測知道結果,當然也可告訴你一般投資人最在意的『勝率』。

這的確符合人性,畢竟大家都想要追求高勝率的交易策略,最好是天天賺,不會賠。可惜金融市場越符合人性的事,就越不是好事。一個有方向性的好策略,通常勝率低於50%,甚至不到40%。也就是輸多贏少。這是因為好的策略其特徵往往是多次的小賠與少次的小賺,再加上幾次極少數的大賺,造就了一般人難以接受的低勝率,但長期下來卻是穩定獲利。

這對大部分的資料科學家是難以接受的。他們用盡各種高深技巧,在市場上收集完整資料,運用訊號處理,機器學習,甚至最近最夯的深度學習,無非就是想要追求高勝率策略。可惜賺錢真的不容易,高勝率低賠率的結果,期望獲利可能還是負值。但也別灰心,這不是資料科學出了問題。這是資金管理沒有學好。千萬別小看這門學問,即使天才如LTCM團隊(長期資本管理公司,由諾貝爾獎得主組成),也是死在這個議題之下。
最簡單的資金管理,賭小一點!

資料科學用在金融交易的真正優勢是,將資金妥善運用於多商品、多市場、多策略,進行彼此之間的關聯統計分析,包含策略是否互補、損益相關係數、甚至發展高頻套利…等。然而,不論資訊科技發展的再進步,資料分析多詳盡,實際交易最重要的還是風險管理,這可是鐵鐺鐺的數學定理,千古不變。舉例來說,如何將資金使用最佳化,為何8成以上的投資者都賠錢? 為何你該賭小一點?今年的資料科學年會,我將向大家介紹這個議題。




0 意見: