基於逐筆成交數據的高頻因子梳理

【百萬研報庫 微信隨心查】研報機器人:DISPLORE_DG

本文分別選取了大買成交金額佔比、買單集中度、盤中主買佔比(佔全天成交)、開盤後日內淨主買強度、開盤後知情主賣佔比以及尾盤知情主買佔比進行分析。股票i在交易日t的指標計算方法如下所示:(更多細節可參考相關專題報告原文)

基於逐筆成交數據的高頻因子梳理

2因子選股能力回測

2.1因子月度選股能力

下表展示了逐筆因子在正交前後的因子月度IC以及前後10%多空收益情況。

基於逐筆成交數據的高頻因子梳理

在正交處理前,買單集中度呈現出了極強的月度選股能力,因子月均IC達0.07,月度多空收益達2.3%。除買單集中度外,開盤後知情主賣佔比(佔同時段成交)以及尾盤知情主買佔比(佔全天成交)同樣呈現出了較為顯著的月度選股能力,因子月均IC達0.04,月度多空收益超1%。

在正交處理後,各因子皆呈現出了較為顯著的月度選股能力。因子月均IC在0.03~0.04之間。此外,各逐筆因子呈現出了較強的穩定性。除買單集中度外,其餘因子年化ICIR皆超過2.0。下圖展示了各因子在正交前與正交後的分10組月度超額收益。

基於逐筆成交數據的高頻因子梳理

各逐筆因子在正交後皆呈現出了較強的組間收益單調性。進一步觀察因子的多頭端收益可以發現,大買成交金額佔比、開盤後知情主賣佔比(佔同時段成交)以及尾盤知情主賣佔比(佔全天成交)具有相對較強的多頭效應。下表分別展示了各因子的分年度多空收益以及月均溢價。

基於逐筆成交數據的高頻因子梳理

各因子在大部分年份中都呈現出了較為顯著的選股能力,並且在近幾年中依舊有效。值得注意的是,買單集中度在2017年以及2019年的表現明顯弱於歷史其他年份。對於開盤後知情主賣佔比,我們可觀察到類似的現象。因子在2018年以及2019年的選股能力明顯弱於歷史其他年份。

2.2不同指數範圍內的選股能力

下表展示了各因子在不同指數範圍內的選股能力。

基於逐筆成交數據的高頻因子梳理

在中證800指數內,大買成交金額佔比、盤中主買佔比(佔全天成交)以及尾盤知情主買佔比(佔全天成交)皆呈現出了較為顯著的選股能力。因子月均IC在0.03~0.04之間,且因子月度多空收益超1%。若比較因子的多頭效應,開盤後知情主賣佔比(佔同時段成交)的多頭效應最強,月均多頭超額收益達0.47%。

在中證500指數內,除了大買成交金額佔比外,其餘因子的選股能力都出現了一定程度的減弱。大買成交金額佔比因子月均IC為0.04,月度勝率達78%,且月度多空收益超1%,而其餘因子月均IC為0.02,月度勝率在60%~70%之間。美中不足的是,大買成交金額佔比在中證500指數內的多頭效應較弱,月均多頭超額收益僅有0.22%,而開盤後知情主賣佔比(佔同時段成交)以及尾盤知情主買佔比(佔全天成交)的月均多頭超額收益在0.40%~0.45%之間。

在滬深300指數內,大買成交金額佔比以及盤中主買佔比(佔全天成交)的選股能力較為顯著。兩因子的月均IC在0.04~0.05之間,月度勝率超70%,且月度多空收益超1%。兩因子同樣有較為明顯的多頭效應,因子的月均多頭超額收益分別為0.33%以及0.56%。

2.2不同指數範圍內的選股能力

當調倉頻率從月度提升至半月度時,因子的ICIR以及年化多空收益皆得到了一定的提升。部分因子的多頭效應也得到了改善。例如,大買成交金額佔比的多頭年化超額收益從5.4%提升至8.3%。開盤後知情主買佔比(佔全天成交)的多頭年化超額收益從8.9%提升至12.3%。

當調倉頻率從半月度提升至周度時,僅有大買成交金額佔比以及尾盤知情主買佔比(佔全天成交)的選股能力得到了進一步的提升。其餘因子的多空年化收益反而出現了小幅下降。更多細節可參考報告原文。

3因子相關性

總體來看,逐筆因子與系統波動佔比、盈利以及盈利增長之間的截面相關性較弱。大買成交金額佔比與市值、估值、前期漲幅以及換手率存在一定的相關性。買單集中度與市值、中盤以及換手率相關性較高。盤中主買佔比(佔全天成交)、開盤後日內淨主買強度以及開盤後知情主賣佔比(佔同時段成交)與前期漲幅存在一定的相關性。

基於逐筆成交數據的高頻因子梳理

下表展示了正交後的逐筆因子之間的截面相關性。大買成交金額佔比與買單集中度存在一定的相關性,盤中主買佔比(佔全天成交)與開盤後日內淨主買強度存在一定的相關性。此外,開盤後日內淨主買強度與開盤後知情主賣佔比(佔同時段成交)強相關,截面相關性達0.47。基於上述結果,投資者在使用逐筆因子時,需儘量避免同時使用高相關的逐筆因子。

基於逐筆成交數據的高頻因子梳理

4因子在組合構建中的應用

本章以月度調倉的中證500指數增強組合為例,展示了逐筆因子在加入組合後對於組合表現的影響。可使用常規因子以及基於分鐘數據計算得到的高頻因子構建基礎增強組合,並分別加入各逐筆因子。下表展示了加入各逐筆因子的組合在2016年以來的分年度表現。

基於逐筆成交數據的高頻因子梳理

觀察上表可知,即使原始模型中已經包含了高頻因子,逐筆因子的引入依舊能夠帶來組合表現的提升。例如,在加入開盤後日內淨主買強度後,組合的年化超額收益從20.4%提升至21.5%。因子的引入使得組合在2016年、2017年以及2020年的表現得到了提升。下圖對比展示了各組合相對於中證500指數的相對強弱指數。

基於逐筆成交數據的高頻因子梳理

逐筆因子的引入能夠對指數增強組合的表現產生進一步的提升。然而,並不是任意因子都一定能夠帶來組合表現的改善。例如,大買成交金額佔比在中證500指數內呈現出了顯著的選股能力,但是因子對於組合並未產生十分顯著的提升。因子的引入對於組合表現的影響取決於組合原有的因子構成、收益預測模型以及風控模型等多方面的因素。投資者需要根據自身的模型設定挑選適合自身的逐筆因子。

5總結

本文梳理並討論了系列前期報告中基於逐筆成交數據計算得到的因子。在全市場月度調倉的設定下,各因子在正交後都呈現出了顯著的選股能力。在中證800指數內,大買成交金額佔比、盤中主買佔比(佔全天成交)以及尾盤知情主買佔比(佔全天成交)依舊呈現出了較為顯著的選股能力。在中證500指數內,除了大買成交金額佔比外,其餘因子的選股能力都出現了一定程度的減弱。在滬深300指數內,大買成交金額佔比以及盤中主買佔比(佔全天成交)的選股能力依舊較為顯著。

當調倉頻率從月度提升至半月度時,因子的ICIR以及年化多空收益皆得到了一定的提升,部分因子的多頭效應也得到了改善。然而,當調倉頻率從半月度提升至周度時,僅有大買成交金額佔比以及尾盤知情主買佔比(佔全天成交)的選股能力出現進一步的提升。其餘因子的多空年化收益反而出現了小幅回落。我們推測這與因子計算窗口的設定有一定的聯繫。

此外,本文以中證500指數增強策略為例,將各因子分別加入模型,並對比了各組合的表現。回測結果表明,逐筆因子的引入的確能夠給組合表現帶來提升。值得注意的是,並不是任意因子都一定能夠帶來組合表現的改善。因子的引入對於組合表現的影響取決於組合的因子構成、收益預測模型以及風控模型等多方面的因素。


分享到:


相關文章: