see:干货 | 量化选股策略模型大全
1 什么是量化选股?
概念: 利用数量化的方法选择股票组合,期望该股票组合能够获得超越基准收益率的投资行为。
2 量化选股策略
包含:
基本面选股、市场行为选股;
2.1 策略:基本面选股
包含:
多因子模型、风格轮动模型、行业轮动模型。
2.1.1 多因子模型
基本原理: 采用一系列的因子作为选股标准,满足这些因子的股票则被买入,不满足的则卖出。
不同多因子模型间核心区别有两个: 因子的选取、如何用多因子综合得到一个最终的判断。
- 应用最广泛的一种选股模型。
- 相对来说比较稳定,因为在不同市场条件下,总有一些因子会发挥作用。
2.1.1.1 概念
例:
如果有一批人参加马拉松,想要知道哪些人会跑到平均成绩之上,那只需在跑前做一个身体测试即可。
那些健康指标靠前的运动员,获得超越平均成绩的可能性较大。
多因子模型的原理与此类似,我们只要找到那些对企业的收益率最相关的因子即可。
2.1.1.2 方法
-
打分法: 根据各个
因子的大小对股票进行打分,然后按照一定的权重加权得到一个总分,根据总分再对股票进行筛选。 -
回归法: 用过去的股票的收益率对多
因子进行回归,得到一个回归方程,然后再把最新的因子值代入回归方程得到一个对未来股票收益的预判,然后再以此为依据进行选股。
2.1.1.3 步骤
五步:
候选因子的选取、因子有效性的检验、有效但冗余因子的剔除、综合评分模型的建立、模型的评价和持续改进。
2.1.1.3.1 候选因子的选取
主要依赖于经济逻辑和市场经验。
选择更多和更有效的因子无疑是增强模型信息捕获能力,提高收益的关键因素之一。
例如:
在2011年1月1日,选取 流通市值 最大的50支股票,构建投资组合,持有到2011年底,则该组合可以获得10%的超额收益率。这就说明了在2011年这段时间, 流通市值 与最终的收益率之间存在正相关关系。
从这个例子可以看出这个最简单的多因子模型说明了某个因子与未来一段时间收益率之间的关系。
同样的,可以选择其他的因子。例如:
- 可能是一些基本面指标,如
PB、PE、EPS增长率等; - 也可能是一些技术面指标,如
动量、换手率、波动等,或者是其它指标,如预期收益增长、分析师一致预期变化、宏观经济变量等。
同样的持有时间段,也是一个重要的参数指标,到底是持有一个月,还是两个月,或者一年,对最终的收益率影响很大。
2.1.1.3.2 因子有效性的检验
主要采用
排序的方法检验候选因子的选股有效性。例如:可以每月检验,
具体而言,对于任意一个候选因子,在模型形成期的第一个月初开始计算市场中每只正常交易股票的该因子的大小, 按从小到大的顺序对样本股票进行排序,并平均分为n个组合,一直持有到月末,在下月初再按同样的方法重新构建n个组合并持有到月末,每月如此,一直重复到模型形成期末。
上面的例子就已经说明了这种检验的方法,同样的可以隔N个月检验,比如2个月,3个月,甚至更长时间。
还有一个参数是候选组合的数量,是50支,还是100支,都是非常重要的参数。具体的参数最优的选择,需要用历史数据进行检验。
2.1.1.3.3 有效但冗余因子的剔除
不同的因子可能由于内在的驱动因素大致相同等原因,所选出的组合在个股构成和收益等方面具有较高的一致性,因此其中的一些因子需要作为冗余因子剔除, 而只保留同类因子中收益最好,区分度最高的一个因子。
例如成交量指标和流通量指标之间具有比较明显的相关性。流通盘越大的,成交量一般也会比较大,因此在选股模型中,这两个因子只选择其中一个。
冗余因子剔除的方法:(假设需要选出k个有效因子,样本期共m月。)
-
先对不同因子下的n个组合进行打分,分值与该组合在整个模型形成期的收益相关,收益越大,分值越高
-
按月计算个股的不同因子得分间的相关性矩阵;
-
在计算完每月因子得分相关性矩阵后,计算整个样本期内相关性矩阵的平均值
-
设定一个得分相关性阀值 MinScoreCorr,将得分相关性平均值矩阵中大于该阀值的元素所对应的因子只保留与其他因子相关性较小、有效性更强的因子,而其它因子则作为冗余因子剔除。
2.1.1.3.4 综合评分模型的建立和选股
综合评分模型选取去除冗余后的有效因子,在模型运行期的某个时间开始,例如每个月初,对市场中正常交易的个股计算每个因子的最新得分并按照一定的权重求得所有因子的平均分。最后,根据模型所得出的综合平均分对股票进行排序,然后根据需要选择排名靠前的股票。例如,选取得分最高的前20%股票,或者选取得分最高的 50 到 100 只股票等等。
举个例子:可以构建一个多因子模型为(PE,PB,ROE),在月初的时候,对这个几个因子进行打分,然后得分最高的50个股票作为投资组合,在下个月按照同样的方法进行轮换替换。持续一段时间后,考场该投资组合的收益率是否跑赢比较基准,这就是综合评分模型的建立和后验过程。
当然这个例子是一个最简单的例子,实战中的模型可能会比较复杂。
比如沃尔评分法就是一个复杂的多因子模型,它是对股票进行分行业比较,算个每个行业的得分高的组合,然后再组合成投资篮子。
2.1.1.3.5 模型的评价及持续改进
一方面,由于量选股的方法是建立在市场无效或弱有效的前提之下,随着使用多因子选股模型的投资者数量的不断增加,有的因子会逐渐失效,而另一些新的因素可能被验证有效而加入到模型当中;
另一方面,一些因子可能在过去的市场环境下比较有效,而随着市场风格的改变,这些因子可能短期内失效,而另外一些以前无效的因子会在当前市场环境下表现较好。
另外,计算综合评分的过程中,各因子得分的权重设计、交易成本考虑和风险控制等都存在进一步改进的空间。
因此在综合评分选股模型的使用过程中会对选用的因子、模型本身做持续的再评价和不断的改进以适应变化的市场环境。
2.1.1.4 影响因素
包含:
有效因子、因子的参数。
例如:
- 到底是
PE有效还是ROE有效; - 到底是采用1个月做调仓周期还是3个月做调仓周期。
这些因子和参数的获取只能通过历史数据回测来获得。
但是在回测过程中,要注意,不能过度优化,否则结果可能反而会不好。
2.1.1.4.1 影响股价走势的主要因子
- 市场整体走势:
市场因子,系统性风险。 - 估值因子:
市盈率、市净率、市销率、市现率、企业价值倍数、PEG等。 - 成长因子:
营业收入增长率、营业利润增长率、净利润增长率、每股收益增长率、净资产增长率、股东权益增长率、经营活动产生的现金流量金额增长率等。 - 盈利能力因子:
销售净利率、毛利率、净资产收益率、资产收益率、营业费用比例、财务费用比例、息税前利润与营业总收入比等。 - 杠杆因子:
负债权益比、资产负债率等。 - 动量反转因子:
前期涨跌幅等。 - 交易因子:
前期换手率、量比等。 - 规模因子:
流通市值、总市值、自由流通市值、流通股本、总股本等。 - 股价因子:
股票价格。 - 红利因子:
股息率、股息支付率。 - 股价波动因子:
前期股价振幅、日收益率标准差等。 - 市场预期因子:
预测净利润增长率、预测主营业务增长率、盈利预测调整等。
2.1.2 风格轮动模型
2.1.2.1 概念
风格轮动模型是利用市场的风格特征进行投资。
比如有时候市场偏好小盘股,有时候偏好大盘股,如果是风格转换的初期介入,则可以获得较大的超额收益。
市场上的投资者是有偏好的,有时候会偏好价值股,有时候偏好成长股,有时候偏好大盘股,有时候偏好小盘股。
由于投资者的这种不同的交易行为,形成了市场风格,因此在投资中,利用市场风格的变化,进行轮动投资会比一直持有的效果好很多。
投资风格: 是针对股票市场而言的,是指投资于某类具有共同收益特征或共同价格行为的股票,即某类投资风格很受欢迎,并且在某一个时间段内具有持续性和连续性(譬如,价值投资和成长型投资两种风格,或者大盘股和小盘股这两种风格总是轮流受到市场追捧).
由于投资风格的存在,从而产生一种叫做风格动量的效应,即在过去较短时期内收益率较高的股票,未来的中短期收益也较高;相反,在过去较短时期内收益率较低的股票,在未来的中短期也将会持续其不好的表现。
比如:在2009年是小盘股风格,小盘股持续跑赢沪深300指数;而在2011年,则是大盘股风格,大盘股跌幅远远小于沪深300指数。如果能事先通过一种模型判断未来的风格,进行风格轮动操作,则可以获得超额收益。
2.1.2.2 晨星风格箱判别法
**晨星风格箱法:**是一个3×3矩阵,从大盘和小盘、价值型和成长型来对基金风格进行划分,介于大盘和小盘之间的为中盘,介于价值型和成长型之间的为混合型,
see:富途牛牛:投资风格箱说明
see:晨星网:晨星投资风格箱方法
共有9类风格,如表所示。
- 规模指标:
市值。通过比较基金持有股票的市值中值来划分,市值中值小于10 亿美元为小盘;大于50亿美元为大盘;10亿~50亿美元为中盘。 - 估值指标:
平均市盈率、平均市净率。基金所持有股票的市盈率、市净率用基金投资于该股票的比例加权求平均,然后把两个加权平均指标和标普500成份股的市盈率、市净率的相对比值相加,对于标普500来说,这个比值和是2。如果最后所得比值和小于1.75,则为价值型;大于2.25为成长型;介于1.75~2.25之间为混合型。
这也就是我们经常看到的基金的分类,比如:华夏大盘、海富小盘等名称的由来。
2.1.2.3 风格轮动的经济解释
宏观经济表现强劲时,小市值公司有一个较好的发展环境,易于成长壮大,甚至还会有高于经济增速的表现,因此,小盘股表现突出的概率高于大盘股。
而当经济走弱时,由于信心的匮乏和未来市场的不确定性,投资者可能会倾向于选择大盘股,起到防御作用,即使低通货膨胀、货币走强,也不足以冒险去选择小盘股。
研究发现,经济名义增长率是用来解释规模效应市场周期的有力变量。
- 当
名义增长率提高时,小市值组合表现更优,因为小公司对宏观经济变动更为敏感, - 当
工业生产率提高、通货膨胀率上升时,小公司成长更快。
2.1.2.4 案例:大小盘风格轮动策略
大小盘轮动最为投资者所熟知,本案例就A股市场的大小盘风格轮动进行实证研究,通过建立普通的多元回归模型来探寻A股的大/小盘轮动规律。
2.1.2.4.1 大小盘风格轮动因子
- **M2同比增速:**M2同比增速为货币因素,表征市场流动性的强弱。当流动性趋于宽松时,小盘股相对而言更容易受到资金的追捧。
- **PPI同比增速:**PPI反映生产环节价格水平,是衡量通胀水平的重要指标;且PPI 往往被看成CPI的先行指标。
- **大/小盘年化波动率之比的移动均值:**波动率表征股票的波动程度,同时也在一定程度上反映投资者情绪;可以认为大/小盘年化波动率之比能够反映出一段时间内大/小盘风格市场情绪的孰强孰弱,而经过移动平滑处理后的数值则更加稳定。
2.1.2.4.2 预测模型
基于上面所讲的风格因子建立如下回归模型:
$$
D(Rt)=α+β1·MGt-1+β2·PGt-3+β3·σt-3+εt
$$
其中,D(Rt)为当月小/大盘收益率差(对数收益率);MGt-1为上月M2同比增速;PGt-3为3个月前PPI同比增速;σt-3为3个月前小/大盘年化波动率之比的移动平滑值;εt为误差项。
本案例采用滚动78个月的历史数据对模型进行回归,得到回归系数后对后一期的D(Rt)进行预测,由修正预测值的正负来进行大/小盘股的投资决策。数据预测期为2004年6月至2010年11月。
2.1.2.4.3 实证结果
在78个月的预测期中,准确预测的月数为42个月,准确率约为53.85%,并不十分理想。但值得一提的是,2009年10月至2010年12月,模型的预测效果非常好,
若从2004年6月开始按照轮动策略进行投资,则截至2010年11月底轮动策略的累计收益率为307.16%,同期上证综指的收益率为81.26%,小盘组合的累计收益率为316.97%;轮动策略稍逊于小盘组合,但仍较大幅度地跑赢了市场指数。
轮动策略在2007年的大牛市中能够很好地跟随大盘股的节奏,而在2009年以来的结构性行情中又能较好地捕捉小盘股的投资机会。
若从2007年初开始采用轮动策略进行投资,则截至2010年11月底累计收益率可达458.65%,大幅超越同期上证综指及大、小盘组合的收益率。
2.1.3 行业轮动模型
行业轮动与风格轮动类似,由于经济周期的原因,总有一些行业先启动,有的行业跟随。
在经济周期过程中,依次对这些轮动的行业进行配置,则比买入持有策略有更好的效果。
与风格轮动类似,行业轮动是另外一种市场短期趋势的表现形式。在一个完整的经济周期中,有些是先行行业,有些是跟随行业。
例如,对某个地方基础设施的投资,钢铁、水泥、机械属于先导行业,投资完后会带来房地产、消费、文化行业的发展,这就属于跟随行业。
研究在一个经济周期中的行业轮动顺序,从而在轮动开始前进行配置,在轮动结束后进行调整,则可以获取超额收益。
国外许多实证研究表明,在环球资产配置中,行业配置对组合收益的贡献的重要性甚至超过了国家配置,而且认为行业配置的重要性在未来相当长一段时间内也将保持。
行业轮动策略的有效性原因是,资产价格受到内在价值的影响,而内在价值则随着宏观经济因素变化而波动。
研究表明,板块轮动、行业轮动在机构投资者的交易中最为获利的盈利模式是基于行业层面进行周期性和防御性的轮动配置,这也是机构投资者最普遍采用的策略。此外,周期性股票在扩张性货币政策时期表现较好,而在紧缩环境下则支持非周期性行业。行业收益差在扩张性政策和紧缩性政策下具有显著的差异。
在国内目前情况下,根据货币供应量的变化来判断货币政策周期,是一个不错的选择。而M2正是广义的货币,反映了社会总需求的变化和未来通货膨胀压力。M2同比增速则可以反映流通中的货币供应量变化,即货币政策效果的实际反应。因此,可以用M2来判断货币政策或者货币供应处于扩张还是紧缩的周期。
通过移动平均线平滑后的M2增速,将2007年6月至2011年12月划分成表所示的几个货币周期。
2.1.3.1 行业分类:周期性VS非周期性行业
为了将行业划分为周期性行业和非周期性行业,这里选取沪深300行业指数,并且以沪深300 指数作为市场组合,利用CAPM 模型计算行业的Beta值和均值方差。
从Beta 值来对行业的周期性和非周期性进行区分:
周期性行业有能源、材料、工业和金融;非周期性行业有可选、消费、信息、医药、电信和公用。
年均收益率最高的行业为医药,其次是金融和公用,收益率最低的行业是可选。
2.1.3.2 案例:M2行业轮动策略
针对上述对周期性行业和非周期行业的划分,构建周期性行业和非周期性行业的轮动策略。
2.1.3.2.1 数据与轮动策略的建立
- **信息的同步性:**考虑到
M2的披露时间及信息的传导时间,所有投资时段都滞后了一个月的时间。 - **组合的构建策略:**在货币政策处于扩张时等权配置周期性行业,紧缩时等权配置非周期性行业。
2.1.3.2.2 策略配置
按照顺周期策略(即策略1)构建投资组合并查看组合的收益及对应的逆向投资(扩张时投资非周期性行业,紧缩时投资周期性行业,初始资金1000万)。
2.1.3.2.3 后验结果
从2007年6月至2011年12 月的策略收益来看,不考虑交易成本,顺周期行业轮动策略获得最高的累积收益(-19.65%)远胜于行业平均(-40.50%)和逆周期策略(-59.13%),逆周期策略表现最差。
此期间业绩基准为沪深300 指数的收益为-37.57%,顺周期行业轮动策略则战胜沪深300 指数达到17.92%,年化超额收益超过3.6%。即便扣除2%的单次换仓成本,行业轮动策略同样远远战胜同期沪深300 指数和行业平均投资策略的表现。
该策略具有如下优点:
- 理念容易理解,且符合自上而下的投资理念,适合机构投资者进行行业配置;
- 将行业划分为
周期性和非周期性进行投资,这种分类标准与实际投资中对行业属性的认识也非常接近,减少了对行业基本面和公司信息的依赖; - 在紧缩时由于选择投资于非周期性行业能够避免较大的不确定性,使得整个组合的风险大大降低,抗风险能力得到增强;
- 依据货币供应增速M2进行轮动,使得策略具有较强的可操作性。
2.1.3.3 附读
行业轮动的规律
或许现在应该从股市周期(经济周期)角度来关心行业轮动问题。由于各个行业对于经济增速和通胀率(利率)的敏感程度不同,这必然意味着在经济周期的不同阶段(对应着不同的经济增速和通胀水平),股市当中的强势行业也会发生变化。
各个行业对宏观经济变量的敏感特性不同。
- 工业类行业:(包括了
制造业、资本品和运输)对GDP 增速更为敏感,这类行业具有较高的固定成本和较为缓慢的产能调节过程,当经济开始提速时工业类行业产能利用率提高可以直接转化为利润,所以,这类行业会在预期经济提速时(或者是牛市的早期阶段)就开始表现较好; - **金融行业:**对
利率(通胀率)的变化更为敏感,利率下行有利于信贷和金融投资。而利率下调往往发生在经济下行期,所以这一时期金融股往往表现较好; - **能源类行业:**对商品价格的变化最为敏感,所以,在价格上涨阶段(也是经济和股市的顶峰期)表现较好;
- **.医药和食品等行业:**对经济减速和通胀上升的敏感度不高,因而成为熊市或者是牛市末期的防御性品种。
我计算了美国股市最近几轮牛熊转化过程中的行业轮动规律,发现股市周期与行业轮动之间具有较强的规律性(尽管也不完全符合教科书式的理想状态)。但这些行业轮动规律对中国是否有意义呢?经过计算,我发现上述行业轮动规律在中国股市要稍微“模糊”一些。
这主要是由于三个原因:
- 中国股市各个行业市值大小差别较大,而美国
标普500 指数中各个行业的市值较为均匀,而这是行业轮动规律能够“完美”表现的重要前提; - 中国股市的各个行业结构不太稳定(由于过去3、4 年大量新股上市所致);
- 部分行业的价格管制抑制了行业对经济变量的正常反应。但如果“剔除”国内股市的特殊因素,
行业轮动机理在中国股市上也都是相似的。例如,07 年中国牛市顶峰阶段表现最好的行业是能源、资本品,而08 年熊市阶段表现最好的是医药和日常消费等等,这些都是行业轮动规律的体现,因此,我们有必要了解一些成熟市场中最稳定的行业轮动规律。
2.2 策略:市场行为选股
包含:
资金流模型、动量反转模型、一致预期模型、趋势追踪模型、筹码选股模型。
2.2.1 资金流模型
基本思想: 利用资金的流向来判断股票的涨跌。如果资金流入,股票应该会上涨,如果资金流出,则股票应该下跌。所以将资金流入流出的情况编成指标,则可以利用该指标来判断在未来一段时间股票的涨跌情况了。
在市场中,经常存在交易性机会,其中一个就是资金流模型,该模型使用资金流流向来判断股票在未来一段时间的涨跌情况,如果是资金流入的股票,则股价在未来一段时间将可能会上涨;如果是资金流出的股票,则股价在未来一段时间会可能下跌,那么,根据资金流向就可以构建相应的投资策略。
2.2.1.1 概念
资金流是一种反映股票供求关系的指标。传统的``量价无法区分市场微观结构中的流动性和私有信息对股价的影响,而根据委托测算的资金流`,能够有效地观察微观市场交易者的真实意图及对股价造成的影响。
资金流定义如下:
证券价格在约定的时间段中处于上升状态时产生的成交额是推动指数上涨的力量,这部分成交额被定义为资金流入;证券价格在约定的时间段中下跌时的成交额是推动指数下跌的力量,这部分成交额被定义为资金流出;证券价格在约定的时间段前后没有发生变化,则这段时间中的成交额不计入资金流量。
2.2.1.2 策略模型
2.2.1.2.1 逆向选择理论法
在非强势有效的A股市场,普遍存在信息不对称的问题。机构投资者与散户投资者在对同一信息的评估能力上存在差异。在大部分情况下,散户投资者缺乏专业的投资能力和精力,那么根据“搭便车”理论,希望借助机构投资者对股价的判断进行投资,一旦机构投资者率先对潜在市场信息做出反应,羊群效应的散户投资者则追涨杀跌,往往导致在很多情况下市场对潜在信息反应过度。这样根据逆向选择理论,能够准确评估信息价值的投资者便会对反应过度的股价做出交易,买入低估的、卖出高估的股票,从而纠正这种信息反应过度行为。
根据市场对潜在信息反应过度的结论及市场投资者的行为特征,可以采取逆向选择模型理论来构建选股模型,即卖出前期资金流入、价格上涨的股票,买入前期资金流出、价格下跌的股票。按照这个思路,对一些指标参数进行回测分析,可以得到稳定的选股模型。
2.2.1.2.2 排序打分法
根据资金流各种指标的特点,在选股模型中采用比较简单的方法,即以指标排序打分的方式来筛选股票。首先通过对各个资金流指标进行排序打分,然后将股票对各个指标的得分进行求和,最后以总得分值大小来筛选股票,
2.2.1.2.2.1 步骤
- 确定待选股票池
- 剔除上市不满一个月的股票,
- 剔除调仓期涨跌停及停牌的股票,防止因涨/跌停无法交易。
- 剔除信息含量小于10%的股票,因为这部分股票信号不明显,无法取得有效信息。
- 构建股票组合
- 指标打分
- 将待选股票池中的股票按照资金流指标进行排序;
- 采用百分制整数打分法进行指标打分,即以股票在各个指标中所处位置的百分数作为股票对于该指标的得分,前1%得分为1,依次递减,最后1%得分为100。
- 指标打分
- 求和排序
- 将股票相对于各个指标的得分进行求和,将和值从小到大排序,进行分组比较;
- 另外,选择排名靠前的N只股票构建组合。
- 股票权重
- 采用等量权重。
- 组合定期调整
- 调整时间从1到3个月不等。持有到期后,利用更新后的指标数据重新确定待选股票池,
- 重复步骤(2)打分求和过程,并将股票按照指标得分从小到达排序,将原来分组中跌出组合的股票剔除,调进新的股票,同时将新组合内样本股的权重调整到相等。
- 统计检验
- 分别计算各组合的收益率情况,考察组合的效果。
2.2.1.2.2.1 案例说明
本案例的结果来自于D-Alpha量化对冲交易系统的后验平台‘模拟交易所’,主要数据情况如下:
-
后验开始时间:2007-2-1,后验结束时间:2011-2-18。
-
股票池范围:沪深300成分股;全市场。
-
资金规模:现货1亿,3亿,10亿;期货:现货=1:1。
-
撮合规则:高频数据撮合,与交易所类似。
2.2.2 动量反转模型
**动量反转模型:**指股票的的强弱变化情况,
- 动量效应: 过去一段时间强的股票,在未来一段时间继续保持强势,过去一段时间弱势的股票,在未来一段时间继续弱势。
- 反转效应: 过去一段时间强的股票,在未来一段时间会走弱,过去一段时间弱势的股票在未来一段时间会走强。
如果判定动量效应会持续,则应该买入强势股,如果判断会出现反转效应,则应该买入弱势股。
2.2.2.1 动量效应
2.2.2.1.1 测试结果
- 从超额收益来看,形成期为4-9个月,持有期为6-10个月的动量组合可以取得较高的超额收益;
- 从战胜基准的频率来看,形成期为6-8个月间,持有期为9-10个月的动量组合战胜基准的频率较高。
- 综合来看,形成期为6个月,持有期为9个月的动量组合在整个样本内表现最佳。
2.2.2.1.2 策略表现
买入前6个月累计收益率最高的一组股票,并持有9个月的动量策略构建的投资组合在考虑单边0.25%的交易成本以后,在长达7年多的测试期中取得了226%的累计收益,远高于同期 沪深300指数取得的117%的累计收益。
在整个测试阶段,动量策略战胜基准的频率为58.43%。这一策略在熊市中表现尤为出色,相对于沪深300平均每个月可以取得1.2%左右的超额收益,信息比率为0.82,熊市阶段战胜基准的频率在65%以上。
2.2.2.2 反转效应
2.2.2.2.1 测试结果
- 从超额收益来看,形成期为1或2个月,持有期为1个月的反转组合可以取得较高的超额收益;
- 从战胜基准的频率来看,短期组合,也即形成期和持有期都为1或2个月的反转组合战胜基准的频率较高。
- 综合前面两个因素,形成期为2个月,持有期为1个月的反转组合在整个样本内表现最佳。
2.2.2.2.2 策略表现
买入前2个月内累计收益率最低的一组股票,并持有1个月的反转策略构建的投资组合在考虑单边0.25%的交易成本以后,在长达7年多的测试期中取得了261%的累计收益,远高于同期沪深300指数取得的117%的累计收益。
在整个测试阶段,动量策略战胜基准的频率为51.69%。这一策略在牛市中表现尤为出色,相对于沪深300平均每个月可以取得接近1.5%的超额收益,信息比率为0.78,牛市阶段战胜基准的频率接近于57%。
2.2.2.3 结论
A股市场存在显著的
动量将就及反转效应。按照形成期为6个月持有期为9个月的动量策略以及形成期为2个月持有期为1个月的反转策略构建的投资组合表现最佳。长期来看
动量策略和反转策略相对于沪深300都可以取得超额收益,
但是动量反转策略在不同的市场阶段表现不同,动量策略在熊市阶段表现优异,而反转策略则在牛市阶段可以取得出色的表现。
因此在A股市场应用动量效应``或者反转效应选择股票时,应根据市场环境在动量策略和反转策略间进行选择,牛市选择反转策略,熊市则选择动量`策略。
2.2.3 一致预期模型
2.2.3.1 概念
概念: 指市场上的投资者可能会对某些信息产生一致的看法,
一致预期策略就是利用大多数分析师的看法来进行股票的买入卖出操作。
比如:
如果大多数分析师看好某一个股票,可能这个股票在未来一段时间会上涨;
如果大多数分析师看空某一个股票,可能这个股票在未来一段时间会下跌。
超一致预期能够带来超额收益。
- 如果年报披露
净利润大幅超预期,则可以年报公布之后买入持有获得超额收益。 - 当然,如果在年报公布之前可以提前通过预测得知大幅超预期,则也可获得事件日前的正超额收益。但是少数年度的超预期带来的超额收益并不明显。可能对某些利用此原理进行事件驱动选股策略的收益有一定影响。
2.2.3.2 影响因子
包含:
预期基本面因子、预期情绪面因子
2.2.3.2.1 预期基本面因子
包含:
预期估值因子、预期成长因子
2.2.3.2.1.1 预期估值因子
预期估值因子中的预期市盈率因子是长期有效的。测试时间区间内:
- 年胜率100%
- 月胜率59.38%
- 日胜率52.92%
但是波动较大,回撤较大。而且在近两年采用该因子选股产生的超额收益远远小于前些年。
通过对复合增长率和预期净利润同比两类预期成长类因子的研究,预期增长的组别的选股表现明显好于预期减速的组别。
而且对预期增长的组别进一步分类,可以得到预期增速处于中等水平的股票在年报后表现更好更稳定的结论。
2.2.3.1.2 预期情绪面因子
最常见的预期情绪面因子如:
- 一致预期净利润变化率
- **净利润一致预期值的环比变动幅度:**也就是指最近一期预期
净利润被调高/调低的幅度。
另外,我们还结合最近一期的涨跌幅构建预期净利润变化率衍生指标(最近一期预期净利润变化率除以最近一期涨幅)- 预期净利润回报。构建的预期净利润回报因子的刻画作用明显优于预期净利润变化率因子。
2.2.3.3 模型构建
综合预期基本面因子和预期情绪面因子构建量化选股模型。
2.2.3.4 结论
综合预期基本面因子和预期情绪面因子构建的策略组合。组合绩效中的各项指标明显好于各单因子选股策略组合。降低了回撤幅度,模拟组合的组合收益还有所提高。平均年化超额收益为15.41%,月度胜率为70.31%,年度胜率100%,超额收益最大回撤5.99%。
2.2.4 趋势追踪模型
趋势追踪是属于图形交易的一种。就是当股价出现上涨趋势的时候,则追涨买入;如果出现下跌趋势的时候,则杀跌卖出,本质上是一种追涨杀跌策略。
判断趋势的指标有很多种,包括MA,EMA,MACD等,其中最简单也是最有效的是均线策略。
衡量股票趋势的指标最重要的就是均线系统,因为它是应用最为广泛的趋势追踪指标,
所以均线是不可或缺的,把它作为捕捉大盘主趋势的基石。
但是纯粹的均线由于噪音等原因,使得经常会出现误操作,需要进行更多的处理机制,包括极点、过滤微小波动、高低点比较策略、高低点突破策略、长波的保护机制、长均线的保护机制等概念和技术细节。
2.2.4.1 均线策略构建步骤
2.2.4.1.1 均线简化
股票价格的波动会让人感觉价格变化飘忽不定,很难把握。为了便于捕捉趋势,所以需要对价格走势曲线进行简化处理,这样可以借助于均线方法。将a个(a为模型参数)连续的交易日的收盘价取一个均值,形成MA(a),比如a为10,即10个交易日数据取一均值,那么就可以得到股价的10日均线U,完成对价格曲线的第一步简化。
2.2.4.1.2 记录极点
极点就是局部的高点或者低点,在极点处股价出现了转折,所以它们是记录股价变化的关键点,包含了比较多的信息。
- 如果股价上涨至此,接下来又出现了下跌,那么就形成一个局部的高点;
- 如果股价下跌至此,接下来又出现上涨,那么就形成一个低点。
这些叫做极点,往往是股价变化的关键信息点,将它们记录下来,以备进一步制定策略。
2.2.4.1.3 设置阀门,过滤微小波动
均线策略最大的优势跟踪趋势效果比较好,在形成趋势时能紧跟趋势,
但是最大的问题在于碰到盘整行情,均线就摇摆不定,容易频繁地发出交易信号,所以必须对其进行进一步处理。
可以结合记录的极点形成过滤微小波动的方法。
当股价形成一个极点M后,接下来股价波动在M点股价的上下B个(B为模型参数)指数点内,就认为股价和M点相比没有变化,这样可以得到过滤了微小波动的均线趋势线W。
2.2.5 筹码选股模型
筹码选股是另外一种市场行为策略。
2.2.5.1 基本思想
- 如果
主力资金要拉升一支股票,会慢慢收集筹码, - 如果
主力资金要卖出一支股票,则会慢慢分派筹码,
所以根据筹码的分布和变动情况,就可以预测股票的未来是上涨还是下跌。
3 量化选股业绩评价标准
包含:
收益率、风险指数。
收益率高的策略并不能成为最好的策略,应该综合考虑收益率和风险情况才能判断一个选股的策略的好坏。
量化选股需要考虑的是在承担多大的风险情况下的收益率情况。