目录

转量化单因子测试一般步骤

目录

转:量化单因子测试一般步骤

作者:JD-Quant

链接:https://www.zhihu.com/question/56533097/answer/149567777

来源:知乎

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

单因子是在只考虑一个目标因子的策略,多因子目标策略试考虑多个因子相互影响下的量化策略。

说一下量化中的单因子测试吧。

单因子测试的目标是为了检验一个目标因子是否具有长期的投资价值,为多因子投资策略的构建打下基础。

单因子测试具体步骤如下:

  1. 选取目标因子:

常见的有价值因子(PB,PE等),市场因子(涨幅,换手率等),基本面因子(资产负债率,流动比率等)以及成长因子(净利润增长率,主营利润增长率等)。

  1. 选取样本市场:

全市场,主板市场,中小板市场等。

  1. 确定调仓频率和测试时间窗:

一般为月度调仓,月初获取上一交易日因子的值。.为了保证样本量,测试时间窗一般为3年以上。

  1. 对于每一个因子在行业内部进行标准化处理,即计算出行业内因子的平均值和标准差,每个因子标准化后的值为(因子值-平均值)/标准差。

  2. 确定投资组合构建方法:

包括非行业中性构建和行业中性构建。

非行业中性构建按照标准化后目标因子的取值大小将股票池分为5组,每组取固定数量股票并按照等权重构建5个投资组合。

行业中性构建是在非行业中性构建的5个分组基础之上,组取固定数量股票并按照行业流通市值占比进行行业权重调整,最终构建5个投资组合。

  1. 对冲: 对于5个投资组合,分别采取beta完全对冲和不对冲方法进行回测。

  2. 结果分析:

计算每个组合,每种对冲方法的年化收益率,月度收益率的平均值和中值,月度收益率的T值,最大回撤,波动率,最大恢复时间,Sharpe比率以及Beta系数。对于采用了对冲方法的回测,按照对冲策略统一标准(考虑收益率、最大回撤以及最长恢复时间)计算综合打分值。对于组别之间,根据最终的累积收益率选择每个组别中表现最好的和最差的,计算这两组净值的日收益率差,以此作为日收益率,计算W_L(Winner-Loser)的收益,同样计算上述的指标。最终根据指标来比较不同投资组合、对冲方法的优劣。

接下来说一下多因子。

举个比较简单的例子,我们认为ROA比较高的一般都是表现比较好的公司,而且小市值代表公司有比较大的发展潜力,那么我们选取ROA大于0.2的公司,并按照市值降序前10等权重构造投资组合,这就是一个最简单的多因子策略。回测结果如下,可以看出这样的多因子策略效果并不好。

<img src="https://i-blog.csdnimg.cn/blog_migrate/0f360049a51745c00eda392f153197ff.png" data-rawwidth="554" data-rawheight="210" class="origin_image zh-lightbox-thumb" width="554" data-original="https://pic3.zhimg.com/v2-fc28ad4a6d645419e056eb493b4a5783_r.jpg"> https://i-blog.csdnimg.cn/blog_migrate/0f360049a51745c00eda392f153197ff.png

在此基础上,我们认为每股收益EPS也是一个很重要的指标,于是选取每股收益EPS大于0.5、ROA大于0.2的公司,按市值降序选前10并等权重构造投资策略,于是得到一个新的多因子策略。该策略3年的测结果如下,效果较上面的策略并没有明显的提升。

<img src="https://i-blog.csdnimg.cn/blog_migrate/424b92894f6560d94bcfd5fcfb8c4282.png" data-rawwidth="554" data-rawheight="202" class="origin_image zh-lightbox-thumb" width="554" data-original="https://pic4.zhimg.com/v2-65b064ea385830575866ae24fe9cca92_r.jpg"> https://i-blog.csdnimg.cn/blog_migrate/424b92894f6560d94bcfd5fcfb8c4282.png

这样的选取因子的方法有太多主观的成分,需要自己不断尝试不同的因子组合才可能得到效果较好的策略,方法的“科学性”有待提高。但是刚接触多因子策略的朋友可以借此来找找感觉,加深对多因子策略的理解,此处推荐京东量化平台的选股宝以供大家学习(

下面我们来简单介绍线性回归选取因子的方法,它利用线性回归模型实现因子和股票的的选取,提高了策略构建的“科学性”。

根据套利定价理论,资产收益率与因子收益率、超额收益率之间存在着线性关系,用多元回归公示表达就是:<img src="https://i-blog.csdnimg.cn/blog_migrate/822bc7c4a29bb6e01f14d4123000fbcf.png" data-rawwidth="521" data-rawheight="33" class="origin_image zh-lightbox-thumb" width="521" data-original="https://pic3.zhimg.com/v2-eb3bbe40de3fbd0bb242c178d5b56dec_r.jpg"> https://i-blog.csdnimg.cn/blog_migrate/822bc7c4a29bb6e01f14d4123000fbcf.png

那么我们首先确定样本集(如沪深300、中证500),选取样本在一定时间窗(一般是一个季度)内的平均对数收益率作为因变量,选取时间窗初的多个待测试因子值作为自变量,并利用逐步回归法进行回归得到参数估计,即的估计值。此处待测试因子可以是各类估值指标、盈利指标、成长指标、技术指标等,而逐步回归法的好处是可以实现对因子进行筛选,克服因子之间的多重共线性,保证所得到的因子集是最优的。

因子选取和模型估计完成之后,我们可以此为根据来进行投资组合的构造。首先我们获得当下n个样本、q个因子的值,将其带入回归方程

<img src="https://i-blog.csdnimg.cn/blog_migrate/546a39eba138597d6cce10c34ef41ac4.png" data-rawwidth="363" data-rawheight="24" class="content_image" width="363"> https://i-blog.csdnimg.cn/blog_migrate/546a39eba138597d6cce10c34ef41ac4.png

即可得到n个样本在下一个时间窗内的平均对数收益率的预测值 ,我们将预测值进行排名,即可选取排名较高的样本按照等权重或按照市值加权来构造投资组合,最终实现多因子策略的构造。

当然这里介绍的都是比较简单的多因子策略,除此之外我们还以分行业构造多因子策略、针对某种类型指标构造多因子策略等等,更多的内容大家可以在京东量化学院和量化社区进行学习。