券商研報復現挑戰賽|回望來時路,砥礪再出發

券商研報復現挑戰賽|回望來時路,砥礪再出發

第一期的研報復現大賽已經落下帷幕啦~

再次感謝朋友們的踴躍參與和大力支持~

所有的匍匐都只是高高躍起前的熱身,

第二期的賽事即將開啟,我們期待您的參與!

第一期研報復現結果回顧

第一期研報復現比賽已經結束,通過15天的社區公開審核,綜合社區人氣指標進行評選,本次研報復現比賽的最終結果公佈如下:

排名前三的作者分別是

>>> 1. 一夢春秋

>>> 2. lan666

>>> 3. k線放蕩不羈

在第一期的研報復現活動中收到了許多小夥伴們的投稿,也感受到了諸位量化愛好者的熱情,再次感謝各位小夥伴對本次比賽的支持與厚愛。

我們也希望通過這樣的活動,能夠傳遞基礎的量化研究方法、瞭解量化策略構建流程,能通過比賽任務的方式促進小夥伴們快速成長。

為此,我們調整了第二期的賽事規則,更多聚焦於研究思路與因子處理過程,任務內容也更加靈活。錯過了第一期比賽任務與未能取得滿意成績的小夥伴,不要灰心哦,第二期即將開始,敬請期待!

券商研報復現挑戰賽|回望來時路,砥礪再出發

第一名研報作品展示

引言

>>> 研究目的

本文參考廣發證券《基於日內高頻數據的短週期選股因子研究-高頻數據因子研究系列一》,對研報構造的因子做了實現,並復現了裡面的結果,做出了分析。其中用個股日內高頻數據構造選股因子,低頻調倉的思路是一個很好的方向。

>>> 研究內容

基於個股日內高頻數據,構建了已實現波動(Realized Volatility) ,已實現偏度(Realized Skewness)、已實現峰度(Realized Kurtosis)因子指標,考察這三個因子在回測區間內對個股收益率 的區別度。

>>> 研究結論

在‍‍‍‍三個因子中‍‍偏度RSkewRSkew因‍‍子最有效,分組區分度高,比較穩定,收益最高。

因子構建

因子構建過程摘自研報,具體因子指標構建如下:

1.對於每個個股在交易日t,首先計算個股在特定分鐘頻率下第i個的收益率

券商研報復現挑戰賽|回望來時路,砥礪再出發

其中,pt,i表示在交易日t,個股在第i個特定分鐘頻率下的對數價格,pt,i-1表示在交易日t,個股在第i-1個特定分鐘頻率下的對數價格。

2.對於每個個股,根據,分別計算個股在交易日t下的已實現方差(Realized Variance) RDV art、已實現偏度(Realized Skewness)RDSkewt,已實現峰度(Realized kurtosis)RDKurtt。其中:

券商研報復現挑戰賽|回望來時路,砥礪再出發

其中N表示個股在交易日t中特定頻率的分鐘級別數據個數,如在1分鐘行情級別下,數據個數N為60*4=240;在5分鐘行情級別下,數據個數N為240/5=48。

1.對於每個個股在交易日t計算累計已實現波動(Realized Volatility)RVolt,已實現偏度(Realized Skewness)RSkewt,已實現峰度(Realized Kurtosis)RKurtt,其中:

券商研報復現挑戰賽|回望來時路,砥礪再出發

在每期調倉日截面上,按照上述公式計算每個個股的已實現波動(Realized Volatility)RVolt,已實現偏度(Realized Skewness)RSkewt,已實現峰度(Realized Kurtosis)RKurtt指標,針對每個由高頻數據計算得到的因子指標在歷史上的分檔組合表現,試圖尋找出相對有效的因子指標。

構造因子數據

>>> 計算因子值的過程比較慢,大概耗時1小時左右。如果直接下載我構造好的數據文件(factor_dict.pkl)上傳到研究裡可以跳過這一步,直接到因子特徵展示開始執行。

>>> 之後開始計算因子值。

因子特徵展示

通過上文中的代碼,已經獲取到了中證500成分股2013-2019的因子數據。

以下分別從因子頻率分佈、因子百分位走勢2個維度展示因子特徵。

>>> 頻率分佈

券商研報復現挑戰賽|回望來時路,砥礪再出發

券商研報復現挑戰賽|回望來時路,砥礪再出發

券商研報復現挑戰賽|回望來時路,砥礪再出發

從以上因子分佈三圖看出,整個A股市場個股的波動率分佈整體上呈現右偏分佈;個股的偏度分佈,整體偏度水平保持在零附近,呈現較為明顯厚尾狀態;個股的峰度分佈與個股波動率水平類似,分佈整體上右偏,且樣本內個股的峰度水平大部分大於3,呈現厚尾的現象。

和研報中的三個因子分佈圖情況和結論相同。

>>> 百分位走勢

券商研報復現挑戰賽|回望來時路,砥礪再出發

券商研報復現挑戰賽|回望來時路,砥礪再出發

券商研報復現挑戰賽|回望來時路,砥礪再出發

從以上三圖看出,個股的波動率在不同的時間維度上變化較大,當市場趨勢行情較明顯時候,個股波動率水平整體上呈現上升的趨勢;個股偏度水平整體較為穩定;個股峰度水平在極端行情下峰度更高,且不同分位數差異更加明顯。

和研報中的三個因子百分位走勢圖情況和結論相同。

實證分析

>>> 因子選股分檔表現

券商研報復現挑戰賽|回望來時路,砥礪再出發

券商研報復現挑戰賽|回望來時路,砥礪再出發

券商研報復現挑戰賽|回望來時路,砥礪再出發

由以上累計收益率5檔圖看出,偏偏度RSkew因子分檔很明顯,單調性顯著;RVol因子分檔不明顯,峰度RKurt因子的區分度比偏度RSkew略微弱一些,但好於RVol因子。

和研報結論相同。

>>> 因子多空收益

券商研報復現挑戰賽|回望來時路,砥礪再出發

券商研報復現挑戰賽|回望來時路,砥礪再出發

券商研報復現挑戰賽|回望來時路,砥礪再出發

從以上多空累計收益三圖可以看出,偏度RSkew因子多空收益最高,也比較穩定,基本上一直在上行,進一步驗證了RSkew因子的有效性。峰度RKurt因子在2013-2014年多空收益在0上下徘徊,和峰度RKurt因子分檔累計收益圖中2013-2014區分度不明顯情況相同。

>>> 因子分析

券商研報復現挑戰賽|回望來時路,砥礪再出發

r_skew ic 小於0的個數佔比:0.6600660066006601

券商研報復現挑戰賽|回望來時路,砥礪再出發

r_kurt ic 小於0的個數佔比:0.66996699669967

券商研報復現挑戰賽|回望來時路,砥礪再出發

從以上IC三圖可以看出,偏度RSkew因子平均IC基本都小於0,且IC負值佔比超過6成,預測能力較好。

偏度RSkew因子在中證500指數下2013-2019年IC小於0的個數佔比為66%,和研報中中證500的IC統計結果近似。受限於研究的內存和因子構建執行時間,我沒有使用全市場數據計算,研報中全市場數據的IC小於0的個數佔比未驗證。

>>> 因子換手率

券商研報復現挑戰賽|回望來時路,砥礪再出發

券商研報復現挑戰賽|回望來時路,砥礪再出發

券商研報復現挑戰賽|回望來時路,砥礪再出發

這裡不知道換手率統計的對不對。我只考慮了兩個調倉日之間,每個檔位更換股票佔原股票的比例。偏度RSkew因子子的換手率比較穩定,基本上每期都要把持倉更換一遍。

看散點分佈情況,換手率分佈大部分在85%以上,考慮到時間選取和算法的不同,和研報中給出的平均80%換手率也算接近。

總結

本研究從因子分佈和因子百分位走勢對因子特徵做了展示,從累計收益率、多空收益、因子IC、換手率幾個角度做實證分析。

總的來說,本研究使用中證500指數2013-2019年的數據選股,對研報中的內容基本上都做了復現,得出結論:三個因子中偏度RSkew因子最有效,分組區分度高,比較穩定,收益最高。


分享到:


相關文章: