2.4 异象检验
学术界对于异象的研究是十分狂热的。在过去30年的时间里,学者们在美股市场中“挖”出了数百个异象。Hou et al.(2020)一文花了非常大的精力复制了452个异象,是一篇很好的总结。不幸的是,他们发现绝大多数被发表的异象并不能获得多因子模型无法解释的显著α收益率,这意味着很多学术研究并没有带来真正科学、正确的结果。本书第6章会对学术界的这种风气进行介绍,本节先来看看如何检验异象。
2.4.1 时序回归检验异象
通过第1章的介绍可知,如果某个资产能够获得多因子模型无法解释的显著超额收益,那么就称该资产为一个异象。在股票多因子研究的范畴内,上述异象资产通常是按照如下几个步骤构造投资组合的:
(1)选择一个潜在的财务指标或者量价指标,以它作为异象变量(anomaly variable)。
(2)根据异象变量取值的高低,将股票在截面上排序,使用排序法构建异象投资组合,并获得异象收益率的时间序列。
(3)检验该异象收益率能否被多因子模型解释。
在给出具体的检验之前,有一点关于异象研究的重要趋势值得一提。在过去,最常见的做法是使用单一异象变量来构建异象。然而,在近些年的研究中,一个主流的趋势是使用多个(即复合)变量来构造异象。当然,这种做法有利也有弊。好的一方面是这些使用多指标构建的异象往往有更强的金融学含义,因此更能够帮助人们理解上市公司基本面和技术面信息与未来预期收益率之间的关系。比如Asness et al.(2019)一文以Quality minus junk为题提出的质量异象。该文三个维度使用了众多指标,最终得出了一个总分对股票排序,构造了异象投资组合。又如Piotroski and So(2012)的研究,它使用两个变量的独立双重排序构建了一个预期差异象,而其中一个排序变量本身就是一个应用了多个财务指标的复合变量。不好的一方面则是使用复合变量更容易出现过拟合。从某种意义上说,研究异象(和因子)其实是对着历史数据进行数据挖掘。一旦使用的变量过多,就容易出现过度挖掘,使得发现的所谓异象仅仅是样本内过拟合的结果。尽管如此,从本书的目标来看,复合变量构成的异象仍然比单一变量构成的异象更加值得探讨。为此,在本书第5章研究异象时,会针对学术界一些非常经典的复合变量异象在A股进行实证。
回到本节的重点,异象检验的第一种方法非常直接,即时间序列回归。令(t=1, 2, ···, T)代表t时刻异象收益率,λt(t=1, 2, ···, T)代表t时刻因子收益率向量(假设共有K个因子)。在检验异象时,原假设是异象收益率中不存在因子无法解释的部分,即α=0。为检验它,用λt作为解释变量、作为被解释变量进行时序回归OLS估计:
式中,是截距项,它是α的估计值,代表异象收益率中无法被多因子模型解释的部分;为该异象在K个因子上的暴露向量的估计,它的取值告诉人们哪些因子对解释异象收益率起了作用;是残差。OLS除了给出上述参数的估计外,还会计算出它们的标准误。由于目标是检验异象能否获得显著超额收益,因此使用计算t-值:
在时序回归中,总的期数为T。另外,解释变量包括一个截距项以及K个因子,故而一共有K+1个解释变量。因此,式(2.51)中t-值满足的t分布的自由度为T-K-1。最后,根据t-值和t-分布就可以计算出p-值,从而决定是否在给定的显著性水平下拒绝原假设。如果原假设α=0被拒绝,那么就称背后的资产为异象。
其实,对于异象的检验到这里就告一段落了。然而,在时间序列回归中有一个必须面对的计量经济学问题。当时间序列的随机扰动有自相关性或者异方差时,OLS的标准误就是不准确的,这就造成计算出的t-值也是失真的。下面2.4.2节首先说明这个计量经济学问题,然后2.4.3节给出解决办法。
2.4.2 计量经济学问题
接下来暂时跳出多因子模型,讨论回归分析中普遍存在的计量经济学问题。考虑总体(population)的广义线性回归模型(generalized linear regression model)公式如下:
其中y是T维向量;X是T×(K+1)解释变量矩阵(其中K是解释变量的个数,外加一个截距项);b是(K+1)维回归系数向量;ε是T维随机扰动向量;Σ(T阶)是ε的协方差矩阵。上述模型和经典线性回归模型最大的区别是正定矩阵Υ的引入。在经典模型中假设给定解释变量X下,ε满足独立且同方差,因此Υ是单位阵I。
在广义线性回归中,ε独立、同方差这两个假设均可被打破,从而得到两个常见的特性:异方差(heteroscedasticity)和自相关(autocorrelation)。在广义线性回归模型中引入Υ正是为了反映ε的上述特性。当仅出现异方差但没有自相关时,σ2Υ满足:
反之,当仅出现自相关但没有异方差时,σ2Υ满足:
式(2.53)和式(2.54)只是给了Υ的两个典型例子。在一般的情况下,自相关和异方差同时存在,Υ矩阵中第i行、第j列的元素则由υij表示。如果矩阵Υ已知,则通常使用广义最小二乘(GLS)对回归系数b进行参数估计。但当Υ未知时,OLS往往是首选。对模型(2.52)使用OLS得到b的估计为:
对式(2.55)两边取期望,如果E[ε|X]=0成立,则有可以推导出的协方差矩阵,记为VOLS(下标OLS表示使用OLS估计):
当ε不存在异方差以及自相关性时,Υ=I。将其代入式(2.56)并进行简单的代数运算就可以得到经典OLS中VOLS的表达式:
VOLS=σ2(X′X)−1 (2.57)
在实际中用样本残差的方差s2代替总体的σ2代入式(2.57),从而得到VOLS的估计,其对角线元素的平方根就是这K+1个回归系数(包括截距项)的标准误,通过它们就可以进行t-检验。然而,当ε存在异方差或者自相关时,上述就不是一个好的估计量。
式(2.56)右侧表达式中除第一项1/T之外,剩余部分可以看成是三个矩阵相乘的形式,其中第一个和第三个仅和解释变量X有关,因此修正自相关和异方差的核心就是正确地估计式(2.56)中的中间矩阵。为了方便讨论,令Q代表中间的矩阵:
式中xi=[xi1, xi2, ···, xiK+1]′,即X的第i行的转置(注意它不等于X的第i列)。一旦能找到在考虑了自相关和/或异方差之后的矩阵Q的估计量,便可通过它进而求出的协方差矩阵的估计量。在这方面,最著名的两个估计量当属White(1980)估计量(仅考虑异方差)以及Newey and West(1987)估计量(同时考虑异方差及自相关)。
2.4.3 White估计量和Newey–West估计量
为了估计Q,需要用到的“武器”恰恰就是解释变量矩阵X,以及回归的样本残差向量。当ε仅有异方差但没有自相关时,Q则简化为仅考虑对角线上的元素:
White(1980)指出使用X以及便可求出Q的渐进估计(记为S0):
将S0代入式(2.56)便得到的协方差矩阵的估计量:
式(2.61)被称为White异方差相合估计量。该结果的优势在于,哪怕人们对异方差的取值或结构一无所知,仍然可以根据OLS的结果进行适当的推断。考虑到实际问题,在资产收益率中无法被多因子模型解释的随机扰动部分的异方差性质未知,上述性质就显得格外重要。在检验异象时,除了异方差外,通常仍需考虑ε的自相关性。为此,一个自然的想法是将上述Q的估计延伸到对角线之外的元素,即:
式(2.62)看似合理,但因其存在两个问题,所以并不正确:(1)该表达式中一共有T2项求和,而求和项之前的比例系数仅仅是1/T,因此S可能不收敛;(2)即便S收敛,它也很可能不是正定的,从而使得的协方差矩阵非正定,这显然有违常理。
为了解决上述问题,Newey and West(1987)给出了在同时考虑ε的自相关和异方差时,中间矩阵Q的相合估计量:
比较式(2.60)和式(2.63)不难发现,后者中的第一项正好对应仅有异方差的情况,而第二项则是针对自相关性的修正。其中J是计算自相关性影响的最大滞后阶数(Newey and West 1994给出了自动计算J取值的自适应算法),wj是滞后期j的权重系数,由其表达式不难看出自相关性的影响随着滞后期j的增大而减小。将式(2.63)中的S代入式(2.56),得到协方差矩阵的Newey–West异方差自相关相合估计量:
将式(2.64)的协方差矩阵对角线上的元素求平方根,就得到回归系数的标准误[1]。该估计量在实证资产定价研究中应用非常广泛,几乎任何一篇分析因子或者异象的论文,在检验收益率显著性时,都会提到诸如“经Newey–West调整后的t-值(Newey–West adjusted t-statistic)”或者“经Newey–West调整后的标准误(Newey–West adjusted standard error)”。这些描述的含义是使用式(2.64)计算回归系数的标准误以及t-值[2]。
再回到本节异象检验的问题中,按照如下步骤即可在OLS回归时对回归系数的标准误进行Newey–West调整:
(1)使用异象收益率作为被解释变量、多因子中K个因子的收益率以及一个截距项(一共K+1项)作为解释变量,进行时序回归OLS估计,得到残差。
(2)使用K+1个解释变量X和残差,根据式(2.63)和式(2.64)计算出经Newey–West调整后的,计算时依照Newey and West(1994)给出的公式确定最大滞后期数J:
上式中表示向下取整。
(3)将的对角线元素开平方,其平方根就是回归系数的标准误(一共K+1个)。
(4)找到截距项的标准误,它对应的就是式(2.50)中的的经Newey–West调整后的标准误按照式(2.51)计算t-值,进行t-检验。
本书在第5章针对A股市场进行异象实证研究时,将采用上述步骤检验异象的显著性。
2.4.4 截面回归检验异象
除了通过时序回归方法检验异象外,Fama–MacBeth截面回归也常被用于检验异象。其背后的逻辑是,异象能获得超额收益则意味着异象变量能够预测资产未来的收益率;而Fama–MacBeth截面回归可以在控制其他因子的同时,检验异象对收益率的预测性。在回归时,使用异象变量以及多因子模型中构造因子的变量同时作为解释变量,以资产(个股或投资组合,通常为个股)超额收益作为被解释变量,在每个时刻t进行截面回归,得到异象变量t期的超额收益,记为(上标α代表异象)。利用该序列,计算异象收益率的均值和均值的标准误(分别记为),然后进行t-检验。如果在控制了因子变量后,该异象的预期收益依然显著,那么就认为它可以获得多因子模型无法解释的超额收益。
由于异象收益率在时序上可能存在异方差和自相关性,因此也可以通过Newey–West调整得到准确的的估计。如何对单个收益率序列进行Newey–West调整呢?正确做法是使用作为被解释变量,Xt=1(t=1, 2, ···, T)作为解释变量,通过OLS求出残差序列。上述OLS的回归系数实际上就等于在时序上的均值,而残差则是收益率和其时序均值之差,它反映了异象收益率的自相关和异方差性。把残差和Xt=1代入式(2.63)即可得到经Newey–West调整的中间矩阵。在针对单一时间序列进行的计算中,中间矩阵为标量(记为Q),因此它的估计S(也是标量)为:
由Xt=1易知X′X=T。将式(2.66)中的S和X′X=T代入Newey–West估计量式(2.64),通过简单运算可得的方差的估计:
将式(2.67)开方就得到经Newey–West调整后的。最终,使用均值计算t-统计量并检验异象预期收益率的显著性。
有必要说明的是,上述检验单一收益率在时序中的Newey–West调整对回归右侧的所有解释变量都成立。如果解释变量是异象变量,那么它检验的就是异象预期收益率是否显著;如果解释变量是因子变量,那么它检验的就是因子预期收益率是否显著。根据2.3节的说明,虽然使用排序法构建因子投资组合并检验其收益率一直以来是学术界的惯例,但是近年来越来越多的研究使用公司特征作为因子暴露,并使用Fama–MacBeth回归检验因子收益率。一旦得到因子收益率的时间序列,就可以使用本节介绍的方法计算因子预期收益率的标准误,并对其检验。除此之外,上述Newey–West调整也可以被应用于排序法中。这意味着首先通过投资组合排序法获得因子的收益率序列,然后计算其均值的标准误时应用式(2.66)和式(2.67),这样便可得到正确的。在本书第3章关于主流因子的实证研究中,将使用排序法构建因子收益率序列,并按照本节的方法计算标准误,检验因子预期收益率。
[1]严格地说,是标准误的估计。
[2]White(1980)估计量也常被用来计算回归系数的标准误。但由于Newey and West(1987)估计量既考虑异方差又考虑自相关,比White(1980)估计量适用性更高,因而得到了更广泛的使用。