量化策略:線性判別分析演算法

微信公眾號:qtaiicom

線性判別分析是一種經典的線性學習方法,在二分類問題上最早由Fisher在1936年提出,亦稱Fisher線性判別。線性判別的思想非常樸素:給定訓練樣例集,設法將樣例投影到一條直線上,使得同類樣例的投影點儘可能接近,異樣樣例的投影點儘可能遠離;在對新樣本進行分類時,將其投影到同樣的直線上,再根據投影點的位置來確定新樣本的類別。

量化策略:線性判別分析演算法

在基於財務比率和其他金融變數的破產預測中,LDA是第一個用來系統解釋公司進入破產或存活的統計學工具。儘管受到財務比率不遵守LDA正態分佈假設的限制,Edward Altman的1968年模型仍然是實際應用的領先者。在市場營銷,判別分析曾經常用於透過市場調查或其他資料收集手段,找出那些能區分不同客戶或產品型別的多個因素。

按照《量化投資策略:多因子到人工智慧》資料中的步驟,搭建機器學習模型,選擇線性判別分析演算法(LDA),構建包括特徵和標籤提取、特徵預處理、樣本內訓練、交叉驗證和樣本外測試等步驟。最終在每個月底可以產生對全部個股下期上漲機率的預測值,然後根據正確率、AUC 等指標以及策略回測結果對模型進行評價。我們的模型設定為月頻換倉,為了讓模型及時學習到市場特徵的變化併兼顧計算效率,我們採用了滾動回測方法,即從 2016年5月1開始,每月底重新構建一次模型,在下一月進行測試。我們還根據模型的預測結果構建了滬深300成份內選股和中證500成份內選股策略,透過年化收益率、夏普比率、最大回撤等指標綜合評價策略效果。

中證500標的收益110%,同期指數15%,超額95%,夏普比率3。15,最大回撤24%。

量化策略:線性判別分析演算法

滬深300標的收益130%,同期指數45%,超額85%,夏普比率2。88,最大回撤27%。

量化策略:線性判別分析演算法

總體而言,這個演算法對中證500指數更加穩定,收益率更高