如何提升選股因子效果-因子的正交

如何提升選股因子效果-因子的正交

本期研究內容參考海通證券研究報告《選股因子系列研究(十七)——選股因子的正交》

引言

>>> 研究目的

近年來,隨著投資者對於因子選股體系研究的深入,選股因子值的處理也在逐漸細化,本文將主要對於選股因子的正交進行分析討論。之所以討論因子的正交是因為在傳統的多因子模型中,選取的因子之間往往存在著相關性,而這種相關性並不穩定,且相關性的存在會複雜因子權重的分配。

對於等權分配因子權重的多因子模型,由於因子之間相關性的存在,模型可能實際上對於某一因子有更高的暴露(例如,市值因子)。 對於權重優化的模型,相關性的影響可能會更大。因此,本文考慮在構建因子的時候對於相關性進行剔除從而達到更為可控的因子暴露。

>>> 研究框架

研報中主要分為三部分。第一部分對於因子正交的必要性以及正交過程中的相關處理方式進行了說明。 第二部分回測對比了正交多因子模型與原始多因子模型的歷史表現。第三部分對於正交順序的確定進行了討論。

本研究主要參考第一部分的處理方法,對第二部分內容進行了實證,按照這個思路,展開研究,下面是研究的內容分佈:

1)因子數據獲取:

  • 設置股票池,獲取指定時間範圍的月度因子數據,按照研報思路,我們直接獲取了聚寬因子庫中的因子數據,並加入行業因子,按日期將因子值存入字典,記錄保存了原始因子值,方便進行計算構造正交因子。

2)因子數據處理:

  • 將計算出來的因子值按日期遍歷獲取,根據需要進行數據處理。
  • 在T期因子值中加入T+1期收益值,方便因子分析統計。

3)因子統計分析:

  • 針對每期截面進行因子IC統計。
  • 彙總為時間序列上的IC數據,進行展示。

4)分組回測分析:

  • 根據所選的因子,在每個調倉日進行股票排序,分層進行收益淨值觀察。
  • 根據所選因子,在每個調倉日進行股票排序,進行多頭組合收益分析。

>>> 參數設置

1)時間範圍:

  • 2014.6 ~ 2019.6

2)研究指數:

  • 中證500

3)股票池:

  • 中證500指數成分股
  • 剔除 ST、停牌、漲跌停、上市不滿 6 個月
  • 月初調倉

4)費用設置:

  • 暫無交易成本設置

>>> 研究內容及結論

本文參考研報中關於選股因子正交的討論,通過使用正交選股因子來得到更加可控的因子暴露,並採取研報中給出的參考順序進行了正交化處理,通過實際組合的構建以及初步回測, 相比於原始因子收益及夏普有所提升。 在三因子與八因子兩種模型中,對因子IC均有提升,在多頭組合中也得到了印證。

處理過程

>>> 因子數據獲取

根據研報中提到的因子,我們直接通過聚寬因子庫獲取,後面會用到行業因子數據,將手動計算加入。

如何提升選股因子效果-因子的正交

>>> 因子數據處理

  • 進行因子數據處理、進行去極值、標準化、中性化。
  • 加入收益數據:將T期因子值中加入T~T+1的收益數據進行記錄。

我們對原始因子值去極值、標準化之後,參考以下研報中給出的順序進行中性化處理。

如何提升選股因子效果-因子的正交

>>> 因子計算與分析

  • IC統計
  • 根據IC值計算等權多因子組合打分
如何提升選股因子效果-因子的正交

>>> 等權多因子模型與最大化收益預期多因子模型

接下來的研究中,以較為經典的三因子模型(市值因子+反轉因子+換手率因子)為例, 按照因子模型分為等權多因子模型、最大化收益預期多因子模型;按照因子處理方式分為原始因子、正交因子分別進行記錄,分組如下。

如何提升選股因子效果-因子的正交

我們將對以上分組的因子IC值進行統計記錄,以上四種分類下的IC值與累計IC值結果如下:

如何提升選股因子效果-因子的正交

如何提升選股因子效果-因子的正交

如何提升選股因子效果-因子的正交

如何提升選股因子效果-因子的正交

從上面四組結果統計中,可以獲得如下信息:

  • 將原始因子進行正交,且在等權分組下IC值最高,也就是factor_b表現最好。
  • 兩種因子模型中,正交因子IC值均大於原始因子IC。
  • 等權多因子模型因子IC遠超最大化收益預期因子IC。
如何提升選股因子效果-因子的正交

如何提升選股因子效果-因子的正交

如何提升選股因子效果-因子的正交

如何提升選股因子效果-因子的正交

以上是針對八個風格因子進行因子正交的結果統計,通過因子IC計算,獲得如下信息:

  • 最大化收益預期模型下,且進行因子正交的表現最好,五年IC均值為0.0318,也就是factor_d分組。
  • 和三因子的測試效果一樣,兩種因子模型中,正交因子IC值均大於原始因子IC值。
  • 在八個風格因子的測試中,最大化收益預期模型要優於等權多因子模型。

>>>分組回測

接下來,我們將對所有因子值進行分組收益統計,並記錄各分組總收益、年化收益、夏普率、最大回撤、每日收益情況,並將分組年化收益進行統計。

如何提升選股因子效果-因子的正交

這裡分組收益結果與IC值統計結果一致,迴歸模型正交因子的分組收益會較好一些。

>>> 因子相關性檢查

我們選取某一期因子數據進行相關性檢查,八個風格因子在處理前後的秩相關係數矩陣如下表所示。

如何提升選股因子效果-因子的正交

如何提升選股因子效果-因子的正交

正交處理後,因子之間的相關性基本上達到了零。

結論

本文參考研報中關於選股因子正交的討論,通過使用正交選股因子來得到更加可控的因子暴露,我們採取研報中給出的參考順序進行了正交化處理,通過實際組合的構建以及初步回測, 相比於原始因子收益及夏普都有所提升。 在三因子與八因子兩種模型中,對因子IC均有提升,在多頭組合中也得到了了印證。


分享到:


相關文章: