因子投资:方法与实践
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.2 多因子模型的回归检验

使用2.1节介绍的排序法,人们可以很容易地针对股票风格因子构建因子投资组合并计算其收益率。然而,多因子模型中最核心的问题是检验一系列因子解释异象的能力。本节就来说明如何使用回归的方法检验多因子模型,其中涉及的不同方法包括时序回归检验、截面回归检验以及Fama and MacBeth(1973)回归检验[1]

在下文的介绍中,令NK分别代表资产和因子的个数。回顾一下本书第1章中的式(1.3),它指出资产预期(超额)收益和因子预期收益率之间满足如下关系:

其中代表资产[2] i的超额收益,βi为资产iK维因子暴露向量;λK维因子预期收益率向量。多因子模型研究的核心问题是资产预期收益率在截面上——即不同的资产之间——为什么会有差异。根据模型(2.12),如果一个资产在因子上的暴露βi高,则它的预期收益也应该更高。

再来仔细品一品这句话,即多因子模型(2.12)研究的是资产预期收益率在截面上的差异。站在本书提出的统一视角下,这是从截面角度来研究多因子模型的。在检验模型(2.12)时,不关心资产的收益率在时间序列上是如何随着每期因子收益率来波动的,只关心在截面上和对应的βi之间的关系,因为模型(2.12)是关于均值的模型。多因子模型中所包含的因子代表了收益率的一种结构。一旦结构给定后,个股或者任何一个投资组合的预期收益率就完全由它在这些因子上的暴露决定了——暴露高,预期收益率就高;预期收益率是因子暴露的线性函数。怎样找到最好的因子结构,即哪些因子使得个股在截面上的预期收益率区分度高,并让不能被该模型解释的定价误差αi部分尽可能低,就是多因子模型研究的问题。

仍然晦涩?用图2.3解释一下(因为要做图,所以假设单因子模型)。图中横坐标为βi,纵坐标为,每个点代表一个资产。图中这条直线就代表E[Ri]=βiλ,它的斜率λ就是因子的预期收益率。当模型不能被完美地满足时,资产的预期收益率E[Ri]和模型算出的βiλ之间就会存在误差,它就是图中的αi

图2.3 截面上股票预期收益率和风险暴露的关系

正如前文反复强调的,多因子模型反映的是预期收益率和因子暴露在截面上的关系。在多因子模型被提出之前,人们最熟悉的因子模型无疑是CAPM。它因为只有一个市场因子,所以是多因子模型的一个特例。人们最早的猜测是市场因子的收益率和个股在该因子上的β就可以解释截面上不同股票收益率之间的区别。但大量的实证结果显示如果把个股的和它们针对市场因子的βi画出来,二者之间的关系并不能很好地满足该模型,说明仅仅用单一市场因子无法很好地解释在截面上的差别。为了反映这一现象,Black et al.(1972)在CAPM的基础上又加入了一个zero-beta因子,该两因子模型能够更好地解释在截面上的差别[3]。再后来,Fama and French(1993)提出了大名鼎鼎的三因子模型,它在市场因子的基础上加入价值(HML)和规模(SMB)两个因子。这些努力都是为了能够更好地解释人们在股票收益率数据中观察到的在截面上的差别。

之所以回顾上面这一小段历史,是为了说明学术界在多因子模型上的各种努力都是为了更好地解释为什么会因资产而异。那么,拿来一个多因子模型,如何定量地评估它是否是一个好的模型呢?为了回答这个问题,首先来看检验中的三个部分:估计值(estimate)、标准误(standard errors)以及检验(test),见表2.3。

表2.3 多因子模型检验的三个部分

对于截面关系式,下文将采用回归分析(regression analysis)来确定。一旦有了估计值和标准误,就可以用它们检验多因子模型。由式(2.12)可知,αi代表了资产i的定价误差。如果能够在统计上证明所有αi都很接近零,则可以说该多因子模型就是很好的模型,即它能够解释资产预期收益率的截面差异。由此可见,多因子模型的回归检验中最重要的就是检验所有αi联合起来是否在统计上足够接近零。除此之外,使用λ的估计值和标准误,同样可以检验每个因子的预期收益率[4]。根据上述说明,多因子模型的回归检验可以简单总结为以下三步:

(1)计算每个资产在所有因子上的暴露βi

(2)通过回归分析对多因子模型进行估计;

(3)联合检验资产定价误差αi以及每个因子的预期收益率λk

无论选择哪些因子(诸如风格因子或宏观经济因子),也无论在确定截面关系时采用时序回归还是截面回归,对多因子模型的检验最终都可以按照上述三步完成。下面先来看看时间序列回归检验。

2.2.1 时间序列回归

时间序列回归(time-series regression)简单直接,Black et al.(1972)最早使用它来检验CAPM。这种方法在回归时使用因子收益率作为自变量(independent variable)或解释变量(explanatory variable),以资产的超额收益率作为因变量(dependent variable)或被解释变量(explained variable)。

此方法更适合分析由风格因子构成的多因子模型,这是因为人们可以使用2.1节介绍的排序法构建风格因子的因子模拟投资组合,并计算其收益率作为解释变量。对于其他类别的因子,比如GDP等宏观经济因子,由于难以应用排序法构建它的因子模拟投资组合以及计算收益率,所以这种方法就无法使用,举例来说,Fama and French(1993)中的价值(HML)和规模(SMB)因子均是风格因子。该文使用独立双重排序构建了这两个因子的投资组合,并计算了它们的收益率时间序列,使用它们就可以方便地进行时间序列回归检验。

λt表示t期因子收益率向量,为资产it期的超额收益率,这二者在时序上满足如下线性关系:

对每个资产i=1, 2, ···, N,使用简单最小二乘(Ordinary Least Squares,OLS)对模型(2.13)进行参数估计。在时间序列回归中,回归方程右侧自变量是因子收益率λt,左侧的因变量是,回归得到资产i在因子上的暴露向量,截距,以及残差。一旦有了λt在时序上取均值就可得:

式中表示对样本数据在时序上取均值;是资产预期收益率和因子暴露在截面上的关系式。时间序列回归中的截距正是资产i的定价误差的估计。由(2.14)可知,时间序列回归的好处是可以方便地估计每个因子的预期收益率。对于任意因子k,其收益率序列λkt在时序上的均值就是因子k预期收益率的估计:

下面仍然以单因子这种最简单的情况来画图,说明上述时间序列回归得到的βi的截面关系长什么样子。图2.4中的直线为=βiλ:当βi=0时,=0;此外,如果用该模型解释因子投资组合本身(即将因子投资组合视作一个资产放在截面关系式的左侧),且根据定义因子投资组合在自身上的暴露为1(即βi=1),因而有λ=0+1×λ。以上论述说明,时间序列回归得到的=βiλ这条直线一定会经过(0, 0)和(1, λ)两点。

图2.4 时序回归示意图

图2.4中所有黑色的实心圆点代表着资产,空心的点代表着因子投资组合。时间序列回归得到的多因子模型=βiλ就是经过原点和空心点的那条直线。所有资产到这条直线的距离就是资产的。需要特别强调的是,在使用时间序列回归时,需对每个资产i分别独立用多因子模型进行时序回归。因此图2.4中的这条直线并不是以最小化的平方和为目的求出的,这是时序回归和本书2.2.2节介绍的截面回归的最大差别(截面回归是以最小化所有的平方和为目标的)。

有了时序回归模型,下一步就是计算各种参数的标准误,并进行检验。当随机扰动εit不存在自相关(autocorrelation)或异方差(heteroskedasticity)时,时序回归参数的标准误可以由OLS的标准公式给出。进一步的,假设εit满足IID正态分布[5],Michael Gibbons、Stephen Ross以及Jay Shanken在Gibbons et al.(1989)一文中给出了检验αi是否联合为零的方法。即便到了今天,该方法仍然是学术界检验和比较因子模型时的首选方法,由于影响深远,所以该方法也由三位教授姓氏的首字母命名为GRS检验。

在GRS检验中,原假设所有αi均为零。定义向量以及=。GRS检验构建了如下满足自由度为T-N-KNF分布的检验统计量(称为GRS test statistic):

有了检验统计量,只需要利用F分布计算出它的p-值就可以判断是接受还是拒绝原假设。需要说明的是,一旦εit之间存在相关性或者异方差,传统OLS的标准误公式就是错误的,且上述检验统计量也是有问题的。在这种情况下,可以采用更强大的计量经济学工具——比如广义矩估计(2.7节会介绍)——来进行检验。尽管如此,GRS检验仍然是非常普及的一种方法。

除了检验αi是否联合为零外,另一个目标是考察每个因子的预期收益率。由于时序回归假设因子收益率的时间序列已知,因此只需要参照2.1.2节的介绍对每个因子的收益率进行t-检验即可,此处不再赘述。最后对时间序列回归检验简要总结如下。

(1)因子收益率时序需已知。使用因子收益率作为解释变量,分别对每个资产进行时序回归,得到该资产在这些因子上的暴露的估计;时序回归中的(截距项)就是截面关系上资产的定价误差。

(2)将时序回归结果在时间上取均值,就得到资产预期收益率和因子暴露在截面上的关系。由于时序回归是对每个资产单独进行的,因此该关系的确定不以最小化所有的平方和为目标。

(3)若(2.13)中的εit满足IID正态分布,则可以通过GRS方法构建F-统计量来检验αi联合是否在统计上为零,否则可以通过广义矩估计等更高级的方法;对于因子预期收益率,可使用t-检验来分析。

2.2.2 截面回归

时间序列回归虽然很方便,但它以因子收益率时序已知为前提。这意味着它更适合处理股票的风格因子,而对诸如GDP、CPI以及利率这样的宏观经济因子无能为力。这时可以选择截面回归(cross-sectional regression)来检验多因子模型,它能够方便地处理因子收益率时序未知的情况。截面回归检验的最终目的自然还是考察βi在截面上的关系,但此方法的第一步仍然是利用时序回归确定资产的因子暴露。

假设t期一组因子的取值为ft=[f1t, f2t, ···, fKt]′(K维阶向量)。首先通过如下时序线性回归模型确定因子暴露:

需要说明的是,在模型(2.17)中,截距项用了符号ai,而非像式(2.13)中的αi。这是因为如果模型(2.17)中的解释变量不是因子收益率,则它的截距项就不是定价误差。采用OLS对模型(2.17)进行估计,在得到资产的因子暴露。之后,进入本方法的第二步:截面回归。在这一步中,使用第一步得到的因子暴露的估计作为解释变量,以资产收益在截面上满足的线性回归模型为:

使用OLS求解模型(2.18)就可以得到因子预期收益率的估计,以及每个资产的定价误差的估计。细心的读者可能发现,在模型(2.18)中并没有出现截距项,而是使用回归的残差直接作为定价误差。这背后的原因是多因子模型假定当不存在模型设定偏误时,资产的预期收益率应该仅由因子暴露和因子预期收益率决定。当然,公式是“死的”,应用是“活的”,Cochrane(2005)指出在进行模型(2.18)截面回归时,也可以考虑包含截距项。加入截距项后,模型(2.18)变为:

仍以单因子为例,图2.5展示了通过截面回归得到的资产预期收益率和因子暴露的截面关系。如果使用OLS对模型(2.18)进行估计,则图2.5中截面回归得到的关系将通过原点并最小化所有残差的平方和。

图2.5 截面回归示意图

为了更方便地给出数学公式,定义全部N个资产在这K个因子上的因子暴露矩阵,它是N×K矩阵;定义N维向量,和N维向量。利用上述数学符号,截面回归模型(2.18)的OLS估计量为:

为了联合检验所有定价误以及每个因子的预期收益率,仅知道是不够的,还需要求出它们各自的标准误。令εt=[ε1t, ε2t, ···, εNt]′(εit是时序线性模型(2.17)中的随机扰动,且定义Σf≡cov(ft)以及Σ≡cov(εt),利用它们并假设ftεt之间相互独立,且它们各自在时序上满足独立同分布,Cochrane(2005)给出了的协方差矩阵:

在实际中,由于真实的ΣΣf未知,故可采用残差向量代替εt,计算样本代替Σ,并使用样本协方差矩阵代入式(2.22)和式(2.23)就得到协方差矩阵的估计。进一步利用它们计算标准误即可进行检验。

尽管上述表达式看上去已经足够复杂了,但仍有两点需要简单说明。第一,在截面回归模型(2.18)中,作为解释变量的因子暴露是从第一步时序回归中得来的,它们是估计值而非真实值。对于模型(2.18)来说,被称为生成的回归变量(generated regressors)。因此在计算标准误时,应该对生成回归变量造成的误差进行修正。对于此,Shanken(1992)给出了解决该问题的修正方法(被称为Shanken修正),即在的表达式中添加系数

在实际应用中,使用。第二,除Shanken修正外,截面OLS回归中存在的另外一个问题是,在截面上αi存在相关性。这种相关性虽然不会影响OLS估计的性质,但是会使OLS计算的标准误存在巨大的误差,造成对标准误的低估。为解决这个问题,可以使用广义最小二乘(Generalized Least Squares,即GLS)代替OLS。

当使用GLS求解截面回归时,估计量的表达式为(以下数学符号中加入了下标GLS以便和OLS表达式进行区分):

当使用GLS并考虑Shanken修正后,为:

在实际中,使用分别代替ΣΣf以及λGLS就得到的估计。利用OLS或GLS得到的标准误,构建如下自由度为N-Kχ2-检验统计量,检验全部N个定价误差是否联合为零:

为了检验因子预期收益率,只需从取出对角线上的元素并开方即可,它们就是K个因子收益率的标准误。对于每个因子,利用其预期收益率和其标准误,计算出相应的t-统计量(自由度T-1)即可进行检验。以上就完成了截面回归检验。接下来简要总结一下。

(1)截面回归不要求因子的收益率时间序列已知,因此应用更加广泛。截面回归的第一步是通过时间序列回归得到每个资产i在因子上的暴露;第二步才是进行截面回归。因此这种方法又被称作两步回归估计(two-pass regression estimate)。

(2)在得到后,使用资产的时序平均收益率进行截面OLS或GLS回归,估计出因子的期望收益率和资产的定价误差

(3)由于的标准误时可以进行Shanken修正。有了估计值和标准误,构建相应的χ2-统计量和t-统计量来进行检验。

最后值得一提的是,截面回归既可以检验由风格因子构成的模型,也可以检验同时包括风格和宏观经济等不同类型的因子的模型。接下来的2.2.3节将比较时序回归和截面回归在分析风格因子上的异同。除此之外,本节使用的OLS和GLS估计中都假设了因子ft和随机扰动εt之间相互独立,且各自在时序上满足独立同分布这个假设。当该假设不成立时,仍然可以使用广义矩估计来进行分析。此外,广义矩估计也可以方便地修正因因子暴露为估计值造成的误差。考虑到本书的侧重,以下不再对此进行展开介绍,感兴趣的读者请参考Cochrane(2005)。在学术界对因子模型的研究中,本节介绍的截面回归方法并不常见,但理解它可以更好地体会不同方法之间的差异,做到融会贯通。

2.2.3 时序回归vs截面回归

2.2.1和2.2.2两节分别介绍了时序回归和截面回归。有意思的是,对于风格因子这种可以通过排序法构建因子模拟投资组合并计算因子收益率时序的情况,既可以使用时序回归又可以使用截面回归来检验多因子模型。那么它们二者的区别是什么呢?

图2.6以单因子为例,直观地比较了二者的区别。时序回归仅在时序上对每个资产进行回归,然后通过在时序上取均值来得到隐含的截面关系。这意味着图2.6中时序回归得到的必然经过(0, 0)和(1, λ)两点(其中λ是因子收益率的时序均值)。反观截面回归,它的第一步和时序回归完全一样,也是使用已有的因子收益率作为解释变量,得到资产的因子暴露的估计。然而在第二步,它没有采用“时序上取平均”,而是以为解释变量,以为被解释变量进行截面回归。以OLS为例,它以最小化所有资产定价误差的平方和为目的。

在时序回归中,每个资产的定价误差的估计来自独立的回归,即每个资产进行一次回归,一共进行N次,得到全部N;而在截面回归中,它第二步的截面回归以最小化所有N的平方和为目标,因此它同时利用了所有资产的数据。从某种意义上来说,这使得截面回归更加合理。对于时序回归,因子的平均收益率就是该因子模拟投资组合收益率在全部T期的均值;而对于截面回归来说,因子收益率通过OLS或GLS确定,它的取值将会和时序回归得到的因子收益率不同。这是二者最大的区别。

看到这里,有的读者朋友也许会问一个问题。对于风格因子,它们的因子模拟投资组合明明已经有了,因子收益率时间序列也有了,只需要通过在时序上取平均就可以得到因子预期收益率,而截面回归却进行了第二步,通过OLS或GLS得到因子预期收益率。这两种方法得到的因子收益率是不同的,那么它们之间有什么差异?到底哪个是更准确的呢?接下来从数学上回答这个问题。

图2.6 时序回归vs截面回归

以OLS为例,由2.2.2节的叙述可知,因子预期收益率的估计量为:

考察式(2.32)等号右侧N×K因子暴露矩阵,因此前面这个表达式得到一个K×N矩阵,它的每一行对应一个因子,每一列对应一个资产。它的第k行可以被视作因子k的一个投资组合,第k行、第i列的数值即为资产i在该投资组合中的权重。因此,这个K×N矩阵恰好构成了多因子模型中全部因子的K个投资组合。接下来,将矩阵相乘,并经过简单的代数运算可得:

为了便于解释,令。式(2.33)展示出了矩阵代表的因子投资组合的非常好的性质。对于任意一个因子k,它的投资组合中资产的权重是的第k行。由于式(2.33)的结果等于单位矩阵I,它说明的第k行和因子暴露矩阵的每一列相乘时,和任何jk列的内积都是0,而和第k列的内积为1。令ωki表示矩阵第k行、第i列的元素,i行、第j列的元素,则上述结果在数学上可以表达为:

的定义可知,前者中的ωki表示因子k的投资组合中资产i的权重,后者中的表示资产i在因子j上的暴露。由此可知,则表示N个资产按权重ωki在因子j上的暴露的加权平均,因为资产权重来自因子k的投资组合,因此这个加权平均也是因子k的投资组合对因子j的暴露。式(2.34)说明因子k的投资组合对任何其他因子jjk)的暴露均为零;而式(2.35)则表明因子k的投资组合对它自己的暴露是1。以上就是式(2.33)的含义。

从上面的论述可知,使用截面回归不仅求出了每个因子的预期收益率,而且还同时得到了每个因子的投资组合。该投资组合满足只对该因子有暴露,而对其他因子没有暴露这个优秀的性质。对于任意一个因子k,很显然截面回归得到的因子投资组合和排序法得到的因子投资组合是不同的,因此截面回归得到的因子预期收益率和时序回归的因子预期收益率[6]也自然不同。由于截面回归得到的投资组合控制了在其他因子上的暴露,因此比起时序回归结果,通常认为截面回归得到的因子收益率能够更加客观地评价因子的风险溢价。这就是两种方法的差异。

图2.7 同时用时序回归和截面回归检验模型

最后,时序回归和截面回归有时也被同时使用,以检验模型选择的因子是否有意义。考虑图2.7中假想的例子。假设对于某个因子,βi在截面上的关系如图2.7中黑色圆点表示,由时序回归定义可知,它的结果经过图中原点和代表因子投资组合的白色空心圆点。由于该直线的斜率为正,因此时序回归求出的因子预期收益率大于零。反观通过截面回归估计,由于这条直线会最小化所有的平方和,因此会得到完全不同的结果:它的斜率为负,表明因子预期收益率小于零。两个模型的背离就反映出挑选的因子可能有问题,需要进一步分析。

2.2.4 Fama–MacBeth回归

1973年,Eugene Fama和James MacBeth在Fama and MacBeth(1973)一文中提出了一个两步回归方法(被称为Fama–MacBeth回归),该文的目的是检验CAPM。该方法非常巧妙地排除了随机扰动在截面上的相关性对标准误的影响,在业界被广泛使用。这篇文章也是计量经济学领域被引用最频繁的文章之一。

与2.2.2节类似,Fama–MacBeth回归的第一步也是通过N个时间序列回归得到每个资产i在全部因子上的暴露,这和截面回归的第一步相同。Fama–MacBeth回归和截面回归检验最大的差异体现在第二步截面回归上。截面回归检验使用在截面上进行一次截面回归。Fama–MacBeth回归在每个时间点t,以t期的收益率为因变量(注意:是t期的收益率,而非全部T期收益率的均值),以为自变量进行截面回归,因而一共进行了T次截面回归。这是Fama–MacBeth回归检验和截面回归检验最大的不同。在t期,资产超额收益和因子收益率在截面上的线性回归模型为:

如果考虑截距项,则有:

比较模型(2.36)和模型(2.18)可知,在截面回归检验中,首先在时序上对t=1, 2, ···, T)取均值,得到资产i的平均收益率在截面上做回归,因此只做了一次截面回归。反观Fama–MacBeth回归,它在每个t对模型(2.36)进行一次OLS估计(如果有T=100期数据,就意味着进行100次截面回归),得到因子收益率和残差的估计。接下来,Fama–MacBeth把T次截面回归得到的T个估计再取平均,最终得到因子预期收益率和每个资产i定价误差的估计:

Fama–MacBeth回归的巧妙之处在于它把T期的回归结果当作T个独立的样本。传统的截面回归检验只进行一次回归,得到因子收益率和定价误差的一个样本估计。而在Fama–MacBeth截面回归得到了每个因子收益率的时间序列以及每个资产定价误差的时间序列,因此可以方便地求出每个因子预期收益率的标准误和每个资产定价误差的标准误:

有了每个因子的预期收益率,如法炮制便可计算t-统计量,并以此来检验因子预期收益率。此外,在有了矩阵之后,使用χ2-统计量检验全部N个定价误差是否联合为零:

从上面的描述不难看出,Fama–MacBeth回归中的截面回归和传统截面回归的区别是:

• Fama–MacBeth截面回归检验先在不同的t上使用OLS(或GLS,下同)对的截面回归模型进行估计,再把估计

• 传统截面回归检验是先把,然后用OLS对均值之间的截面回归关系进行一次估计,直接得到

简单来说,Fama–MacBeth截面回归是“先估计、再均值”,而传统截面回归是“先均值,再估计”,因此,Fama–MacBeth回归可以被理解为一种特殊的截面回归。较2.2.2节的方法而言,Fama–MacBeth回归的优势是可以排除αit的相关性对标准误的影响。有必要指出的是,当截面回归中的解释变量在全部T期上不变时,以上两种方法得到的估计是相同的,但Fama–MacBeth在应对αit的截面相关性上仍然有优势。

在实际应用中,由于Fama–MacBeth方法具有灵活性,不必限制全部T期截面回归中因子暴露βi保持不变。事实上,在Fama and MacBeth(1973)中,两位作者在时序回归估计βi时便采用了滚动窗口,因此因子暴露向量在不同的时刻t会发生变化[7]。具体来说,对于t期,使用截至t-1期的一段给定窗口的历史数据进行时序回归估计因子暴露βit−1。由于它是使用截至t-1期的数据估计的,因此因子暴露向量的时间下标是t-1。使用估计值作为t期截面回归的解释变量,得到如下的截面回归模型:

或考虑截距项的情况:

在每个时刻t对模型(2.45)或模型(2.46)进行OLS估计就是时变因子暴露的Fama–MacBeth回归。比起全局都用同样的因子暴露,这种方法在实际的研究和投资实践中的应用更加广泛。

下面来说一说Fama–MacBeth回归的不足。首先,它对于αit在时序上的相关性无能为力[8]。其次,由于截面回归中用到的并不是真实的,而是通过时间序列得到的估计值,因此存在误差。Fama–MacBeth回归对此也无能为力,仍然需要Shanken修正。话虽如此,Fama–MacBeth回归通过在截面回归时“先回归,再均值”的思路巧妙地排除了αit截面相关性的影响,得到了学术界的广泛认可,影响深远。时至今日,在计量经济学做面板分析的文章中,仍有约1/3的文章采用Fama–MacBeth回归(Petersen 2009),且几乎在每篇研究资产定价的论文中都可以见到它的身影。Fama–MacBeth回归的要点总结如下。

(1)Fama–MacBeth回归是一种截面回归。和普通截面回归一样,它的第一步也是通过时间序列回归得到资产在因子上的暴露

(2)在得到后,在每个t(共T期)使用OLS对资产超额收益率的截面线性回归模型进行估计,得到t期因子的收益率的估计。在通过T次截面回归,得到T个估计后,将它们在时序上取均值得到因子预期收益率和残差均值。此外,利用,以检验资产定价误差和因子预期收益率。

(3)Fama–MacBeth回归排除了αit的截面相关性对标准误的影响,但是对时序相关性无能为力。

和其他回归模型一样,Fama–MacBeth截面回归的主要目的是检验多因子模型解释资产超额收益的能力,即αi联合起来在统计上是否为零。但在学术界的实证资产定价研究中,学者们更多的时候是用它来检验因子预期收益率λk。由于可以方便地得到因子收益率序列从而求出其均值和标准误,因此它可以轻松地胜任这个任务。在使用Fama–MacBeth回归检验因子预期收益率时,学术界通常采用带截距项的模型(2.46),其目的是排除模型设定偏误的影响。2.3节会对因子预期收益率检验做更深入的探讨。

2.2.5 不同回归方法比较

前文2.2.1节、2.2.2节以及2.2.4节分别介绍了时序回归、截面回归和Fama–MacBeth回归三种检验多因子模型的回归方法。对于这些方法,在笔者平日阅读学术论文和自身研究因子时有两点体会,在此分享给读者。

首先,所有模型都是“不完美”的。这句话的意思是,当把足够多的资产放在回归模型的左侧时,任何一个多因子模型都会被拒绝(即若资产定价误差联合起来为零,则被拒绝)。人们研究多因子模型的动机不应追求它们在统计上多么“完美”,而应该关注每个因子背后到底有多少逻辑。在实证资产定价的研究中,往往不会使用个股作为资产去检验模型(否则模型一定会被拒绝),而是依据一些规则把股票“打包”构成投资组合,然后使用这些投资组合作为资产去检验多因子模型。这是学术界最常见的做法。

其次,在检验多因子模型时,不同的方法在很大程度上可以说都是“殊途同归”,它们之间的差异也许都没有它们名字的差异大;在特定的假设下,不同的方法往往是等价的。比如,当因子暴露在时序上不变时,那么传统截面回归和Fama–MacBeth截面回归的结果是一致的。在应用中,可以通过比较不同检验方法的结果来加深对多因子模型的认知,这才是学习不同方法最大的价值。

[1]本节的介绍专注于对核心概念的解释,数学部分仅在最低限度包括必要的内容。对不同回归检验方法的数学背景感兴趣的读者可参考Cochrane(2005)。

[2]一个资产可以是一支股票也可以是由一揽子股票构成的一个投资组合。

[3]为了纪念Fischer Black,后人将该模型称为Black CAPM模型。

[4]根据2.1.2节的说明,在因子研究中原假设通常为因子预期收益为零。因此,检验时关注的是能否在给定的显著性水平下拒绝原假设。

[5]IID是独立同分布之意,其英文全称为independent and identically distributed。

[6]它是排序法得到的因子模拟投资组合的收益率的时序平均。

[7]对时变因子暴露的研究也是当下实证资产定价研究的前沿课题之一。

[8]一般认为,股票收益率的时序相关性很微弱、截面相关性很高,因此使用Fama–MacBeth回归并不会遇到太大的问题。Petersen(2009)分析了不同的回归方法在分析面板数据(panel data)时由于忽略随机扰动的时序或截面相关性而导致不准确的标准误(低估了其真实值)。