機器學習在選股策略應用—以隨機森林為例
近年來,指數化投資愈來愈盛行,策略型投資如 Smart Beta 更是受到市場青睞。國內外機構法人不再安於傳統 Top down 的投資方式。將部分資產從以往重視區域曝險、國家曝險或產業別曝險,推進為因子曝險!為 Smart Beta 投資燃起一股旋風!
本支影片分享今年發表於Springer的Journal of Banking and Financial Technology之文章,主要談論機器學習在選股策略的應用,並於2021 PyCon x PyHug meet up中公開分享。
1. Smart Beta 與 機器學習之差異
Smart Beta為一種傳統人為建構rule-based方法,像是我們觀察到具有某些現象的股票表現很好,我們就把這些現象轉化為規則,依據這些規則來投資。在Smart Beta中,這些現象主要以因子為主,而我們將這些可能為我們帶來風險溢酬的因子稱之為Smart Beta。
2. 模型優化
本篇文章中,在我們蒐集的資料裡面,有很大一部分的佔比都與價格相關,再加上時間序列的處理,因日資料能夠細部切割,造成更多特徵的比重都著重在價格上面。或許是因為這樣,導致我們最終做出來的模型有著些微動能因子策略的影子,在牛市中大幅outperform benchmark,,在熊市中卻大幅underperform benchmark。因此,若是我們能夠採用更多元的資料來建構特徵,或許有機會改善這樣的現象。
機器學習 - 應用
鬧鐘響 起,小明大喊著:「Hey,Siri!幫我關閉鬧鐘!」,Siri 回應:「小明,已經幫你關閉上午7點的鬧鐘。」小明慵懶地盥洗過後,開啟新聞頻道,看著氣象預報:今日台北天氣濕冷,平均溫度15度,最高溫18度,最低溫9度. 。想到今早有貴重的客戶來訪,小明決定早點進公司,索性叫了台 Uber,舒適地在後座滑著手機,打開 FB App,看著財經粉絲專頁的股市分析文章,頁面還不時彈出理財投資的廣告,到達公司後,透過臉部辨識系統,通過公司的門禁管制入口.
短短不到兩個小時的時間,從起床到公司的過程,生活細節中結合了多少機器學習的應用,語音的處理、機器的認知、天氣預報、溫度的預測、Uber 車輛配置、財經分析、廣告投放、臉部辨識. 等,皆為機器學習的應用。
機器學習在演算法交易中的應用 - 回歸 (Regression)
- 分類 (Classification)
(3) 醫療數據分析、影像辨識 - 疾病預測
- 分群 (Clustering)
分群也就是非監督式學習的經典應用,相較於分類的機器學習演算法來說,分群相關的研究較少,但部分機器學習專家深信:分群將會是未來邁向強人工智慧的關鍵。(目前發展的人工智慧仍屬於弱人工智慧)分群常見的應用如下:
(3) 畫作風格轉移 (GAN,生成對抗網路)
- 關聯性 (Association)
關聯性分析最經典的應用即為 Walmart 啤酒&尿布一例(沒看過可參考:大數據崛起一文文末),簡單來說,從事物發生or出現的頻率中,交叉計算出不同事物同時出現的關聯性及依賴性。應用如下:
(1) 賣場促銷活動 (分析客戶購買行為)
(2) 故障排除機制 (分析故障發生主因)
- 推薦系統 (Recommendation)
(2) 商品廣告推薦 (網頁廣告、彈出視窗)
(3) Youtube/Netflix 影音串流推薦
以上簡單舉例機器學習常見的應用,我們可以發現:機器學習已廣泛地出現在我們生活當中,人工智慧時代並非未來式,而是現在進行式,未來機器學習能有什麼更創新的應用,相信大家也都相當好奇,就讓自由團隊持續為大家解密! 若您有其他想法,歡迎提出您的觀點與建議,進一步與我們交流! ( [email protected] )