02.26 基于逐笔成交数据的高频因子梳理

【百万研报库 微信随心查】研报机器人:DISPLORE_DG

本文分别选取了大买成交金额占比、买单集中度、盘中主买占比(占全天成交)、开盘后日内净主买强度、开盘后知情主卖占比以及尾盘知情主买占比进行分析。股票i在交易日t的指标计算方法如下所示:(更多细节可参考相关专题报告原文)

基于逐笔成交数据的高频因子梳理

2因子选股能力回测

2.1因子月度选股能力

下表展示了逐笔因子在正交前后的因子月度IC以及前后10%多空收益情况。

基于逐笔成交数据的高频因子梳理

在正交处理前,买单集中度呈现出了极强的月度选股能力,因子月均IC达0.07,月度多空收益达2.3%。除买单集中度外,开盘后知情主卖占比(占同时段成交)以及尾盘知情主买占比(占全天成交)同样呈现出了较为显著的月度选股能力,因子月均IC达0.04,月度多空收益超1%。

在正交处理后,各因子皆呈现出了较为显著的月度选股能力。因子月均IC在0.03~0.04之间。此外,各逐笔因子呈现出了较强的稳定性。除买单集中度外,其余因子年化ICIR皆超过2.0。下图展示了各因子在正交前与正交后的分10组月度超额收益。

基于逐笔成交数据的高频因子梳理

各逐笔因子在正交后皆呈现出了较强的组间收益单调性。进一步观察因子的多头端收益可以发现,大买成交金额占比、开盘后知情主卖占比(占同时段成交)以及尾盘知情主卖占比(占全天成交)具有相对较强的多头效应。下表分别展示了各因子的分年度多空收益以及月均溢价。

基于逐笔成交数据的高频因子梳理

各因子在大部分年份中都呈现出了较为显著的选股能力,并且在近几年中依旧有效。值得注意的是,买单集中度在2017年以及2019年的表现明显弱于历史其他年份。对于开盘后知情主卖占比,我们可观察到类似的现象。因子在2018年以及2019年的选股能力明显弱于历史其他年份。

2.2不同指数范围内的选股能力

下表展示了各因子在不同指数范围内的选股能力。

基于逐笔成交数据的高频因子梳理

在中证800指数内,大买成交金额占比、盘中主买占比(占全天成交)以及尾盘知情主买占比(占全天成交)皆呈现出了较为显著的选股能力。因子月均IC在0.03~0.04之间,且因子月度多空收益超1%。若比较因子的多头效应,开盘后知情主卖占比(占同时段成交)的多头效应最强,月均多头超额收益达0.47%。

在中证500指数内,除了大买成交金额占比外,其余因子的选股能力都出现了一定程度的减弱。大买成交金额占比因子月均IC为0.04,月度胜率达78%,且月度多空收益超1%,而其余因子月均IC为0.02,月度胜率在60%~70%之间。美中不足的是,大买成交金额占比在中证500指数内的多头效应较弱,月均多头超额收益仅有0.22%,而开盘后知情主卖占比(占同时段成交)以及尾盘知情主买占比(占全天成交)的月均多头超额收益在0.40%~0.45%之间。

在沪深300指数内,大买成交金额占比以及盘中主买占比(占全天成交)的选股能力较为显著。两因子的月均IC在0.04~0.05之间,月度胜率超70%,且月度多空收益超1%。两因子同样有较为明显的多头效应,因子的月均多头超额收益分别为0.33%以及0.56%。

2.2不同指数范围内的选股能力

当调仓频率从月度提升至半月度时,因子的ICIR以及年化多空收益皆得到了一定的提升。部分因子的多头效应也得到了改善。例如,大买成交金额占比的多头年化超额收益从5.4%提升至8.3%。开盘后知情主买占比(占全天成交)的多头年化超额收益从8.9%提升至12.3%。

当调仓频率从半月度提升至周度时,仅有大买成交金额占比以及尾盘知情主买占比(占全天成交)的选股能力得到了进一步的提升。其余因子的多空年化收益反而出现了小幅下降。更多细节可参考报告原文。

3因子相关性

总体来看,逐笔因子与系统波动占比、盈利以及盈利增长之间的截面相关性较弱。大买成交金额占比与市值、估值、前期涨幅以及换手率存在一定的相关性。买单集中度与市值、中盘以及换手率相关性较高。盘中主买占比(占全天成交)、开盘后日内净主买强度以及开盘后知情主卖占比(占同时段成交)与前期涨幅存在一定的相关性。

基于逐笔成交数据的高频因子梳理

下表展示了正交后的逐笔因子之间的截面相关性。大买成交金额占比与买单集中度存在一定的相关性,盘中主买占比(占全天成交)与开盘后日内净主买强度存在一定的相关性。此外,开盘后日内净主买强度与开盘后知情主卖占比(占同时段成交)强相关,截面相关性达0.47。基于上述结果,投资者在使用逐笔因子时,需尽量避免同时使用高相关的逐笔因子。

基于逐笔成交数据的高频因子梳理

4因子在组合构建中的应用

本章以月度调仓的中证500指数增强组合为例,展示了逐笔因子在加入组合后对于组合表现的影响。可使用常规因子以及基于分钟数据计算得到的高频因子构建基础增强组合,并分别加入各逐笔因子。下表展示了加入各逐笔因子的组合在2016年以来的分年度表现。

基于逐笔成交数据的高频因子梳理

观察上表可知,即使原始模型中已经包含了高频因子,逐笔因子的引入依旧能够带来组合表现的提升。例如,在加入开盘后日内净主买强度后,组合的年化超额收益从20.4%提升至21.5%。因子的引入使得组合在2016年、2017年以及2020年的表现得到了提升。下图对比展示了各组合相对于中证500指数的相对强弱指数。

基于逐笔成交数据的高频因子梳理

逐笔因子的引入能够对指数增强组合的表现产生进一步的提升。然而,并不是任意因子都一定能够带来组合表现的改善。例如,大买成交金额占比在中证500指数内呈现出了显著的选股能力,但是因子对于组合并未产生十分显著的提升。因子的引入对于组合表现的影响取决于组合原有的因子构成、收益预测模型以及风控模型等多方面的因素。投资者需要根据自身的模型设定挑选适合自身的逐笔因子。

5总结

本文梳理并讨论了系列前期报告中基于逐笔成交数据计算得到的因子。在全市场月度调仓的设定下,各因子在正交后都呈现出了显著的选股能力。在中证800指数内,大买成交金额占比、盘中主买占比(占全天成交)以及尾盘知情主买占比(占全天成交)依旧呈现出了较为显著的选股能力。在中证500指数内,除了大买成交金额占比外,其余因子的选股能力都出现了一定程度的减弱。在沪深300指数内,大买成交金额占比以及盘中主买占比(占全天成交)的选股能力依旧较为显著。

当调仓频率从月度提升至半月度时,因子的ICIR以及年化多空收益皆得到了一定的提升,部分因子的多头效应也得到了改善。然而,当调仓频率从半月度提升至周度时,仅有大买成交金额占比以及尾盘知情主买占比(占全天成交)的选股能力出现进一步的提升。其余因子的多空年化收益反而出现了小幅回落。我们推测这与因子计算窗口的设定有一定的联系。

此外,本文以中证500指数增强策略为例,将各因子分别加入模型,并对比了各组合的表现。回测结果表明,逐笔因子的引入的确能够给组合表现带来提升。值得注意的是,并不是任意因子都一定能够带来组合表现的改善。因子的引入对于组合表现的影响取决于组合的因子构成、收益预测模型以及风控模型等多方面的因素。


分享到:


相關文章: