1.1 统一视角下的因子投资
1.1.1 一个公式
20世纪60年代,资本资产定价模型(Capital Asset Pricing Model,CAPM[1])问世。在CAPM被提出之前,人们对于风险如何影响一个公司的资本成本(cost of capital),进而如何影响预期收益率并没有清晰的认识。1958年,Modigliani and Miller(1958)提出了著名的资本结构无关原理(也被称为MM定理)。该定理认为在不考虑税收、破产成本、信息不对称,且市场有效的假设下,企业价值不会因为企业融资方式改变而改变。然而,MM定理使得如何刻画风险和预期收益率之间的关系变得更加扑朔迷离。直到CAPM的诞生,才首次清晰地描绘出风险和收益率之间的关系。
根据CAPM理论,资产的预期超额收益由下面这个一元线性模型决定:
E[Ri]-Rf=βi(E[RM]-Rf) (1.1)
其中E[.]是期望符号,Ri为某资产i的收益率,Rf为无风险收益率,RM为市场组合的预期收益率。式中βi=cov(Ri, RM)/var(RM)刻画了该资产收益对市场收益的敏感程度,它也被称为资产i对市场风险的暴露程度。CAPM正是最简单的线性因子模型,它指出资产的预期超额收益率由市场组合的预期超额收益率和资产对市场风险的暴露大小决定,而市场组合也被称为市场因子。
式(1.1)这个简单的关系为后续大量线性多因子定价模型的研究拉开了序幕。人们发现不同资产的收益率并非由单一的市场因子决定,而是同时受到其他因子的影响。以此为契机,Ross(1976)提出了著名的套利定价理论(Arbitrage Pricing Theory,APT),在CAPM的基础上做了进一步延伸,构建了线性多因子定价模型(简称多因子模型)。多因子模型假设资产i的预期超额收益由以下多元线性模型决定:
其中表示资产i的预期超额收益,βi是资产i的因子暴露(factor exposure)或称因子载荷(factor loading),λ是因子预期收益(factor expected return),也常被称为因子溢价(factor risk premium)[2]。式(1.2)中引入符号代表预期超额收益而舍弃了E[Ri]-Rf,原因如下。对于个股或者由若干支股票组成的纯多头投资组合这类资产,它的预期超额收益是E[Ri]和无风险收益率Rf之差,即E[Ri]-Rf。在实证资产定价中,另一类常见的资产是通过多空对冲构建的资金中性投资组合,例如做多一定金额的股票,同时做空同样金额的股票。依照定义,这类资产的预期超额收益率就是多头和空头预期收益之差,无须额外减去无风险收益率。因此,使用代表资产的预期超额收益更具一般性。此外,在资产定价研究中,由于学术界默认的研究对象始终是资产的预期超额收益,因此约定俗成在称呼上舍去“超额”二字而仅用预期收益率。为了表达的便利性,本书将遵循这种惯例,后续统一称为预期收益率。
和CAPM类似,多因子模型假设资产的预期收益率由公式(1.2)右侧的一系列因子的预期收益率和资产在这些因子上的暴露决定。它表明多因子模型研究的是不同资产预期收益率之间的差异,而非单一资产收益率在时间序列(又叫时序,书中为了不同对应关系,两种叫法会混用)上的变化。在多因子模型研究的术语中,不同资产预期收益率的差异通常被称为(横)截面(cross-sectional)差异,给定因子的预期收益率,资产预期收益率的高低由它在这些因子上的暴露βi大小决定。多因子模型在数学上简单、优雅,它允许人们在式(1.2)的右侧加上任何可能影响资产预期收益率的因子。然而,实际的金融市场十分复杂,影响资产收益率的原因层出不穷又千变万化。因此,虽然式(1.2)给出了市场均衡状态下资产的预期收益率,但在实际中式(1.2)左、右两侧往往并不相等,而是存在一个定价误差(pricing error):
上式中αi就是资产i的实际预期收益率和多因子模型隐含的预期收益率之间的定价误差。该误差产生的原因可以从以下两方面来考虑:
(1)模型设定偏误,即式(1.2)右侧遗漏了重要的因子。当被遗漏的因子被加入后,即可消除误差。
(2)模型本身没有问题,但由于资产收益率的实际数据仅仅是总体的一个样本,因此误差总是存在的。这时需要通过统计方法检验误差αi是否显著不为零:
•如果αi并非显著的偏离零,那么可以认为它的出现仅仅是因为运气的原因;
•如果αi显著偏离零,它则代表了某个可以通过套利而获得超额收益的机会[3];它也同时说明由于某些原因,市场对该资产出现错误定价(mispricing),从而导致其实际预期收益率和多因子模型下的预期收益率出现了偏离。
如何选择因子来构建多因子模型,如何计算资产在因子上的暴露以及因子的收益率,如何使用统计学的方法对定价误差αi进行正式检验就成了使用多因子模型研究资产定价时必须回答的问题。而多因子模型一经提出,用来回答上述问题的相关理论也得到了迅速的发展。如今多因子模型早已成为实证资产定价(empirical asset pricing)研究的最主要方法,也由此在投资实务中催生了一个全新的类别——因子投资(factor investing)。
作为当今一个重要的投资类别,因子投资中涉及的内容非常丰富,但所有的方面都可以围绕式(1.3)来展开和讨论,形成一个关于因子投资的统一视角。为了更好地解释因子投资包含的内容,以下先对式(1.3)的三个成分加以说明,它们是因子、多因子模型以及异象。
1.1.2 因子、多因子模型和异象
图1.1展示了式(1.3)中的三个成分。在多因子模型中,中包含了多个影响式(1.3)左侧资产收益率的解释变量,每个解释变量代表了一个因子。多个因子的预期收益率以及资产在它们上的暴露放在一起构成的就是多因子模型。对于某个给定的资产i,如果它的实际预期收益率和多因子模型隐含的预期收益率之间的误差αi显著不为零,则称这个资产为一个异象(anomaly)。
因子投资中最重要的自然是因子。那么,因子到底是什么?如何选择因子?由式(1.3)可知,它左侧不同资产的收益率均可以归结到有限个因子的收益率上,而不同资产预期收益率的高低由它们对因子的暴露大小决定。由此可以得出因子的定义:
一个因子描述了众多资产共同暴露的某种系统性风险,该风险是资产收益率背后的驱动力;因子收益率正是这种系统性风险的风险溢价或风险补偿,它是这些资产的共性收益。
图1.1 式(1.3)的三个成分
下面通过一个来自Ang(2014)的类比加深对上述定义的理解。Ang(2014)将因子之于资产类比于营养之于食物。人们的日常生活离不开摄入各种食物,比如米饭、谷物、肉类和乳制品等。这些食物之所以对人体重要是因为它们所包含的营养成分,例如水、碳水化合物、蛋白质、纤维和脂肪等。这些营养成分就是食物的“因子”。每种食物对人体的价值体现在两方面:(1)它包含哪些营养成分以及包含了多少(类比多因子模型中的βi);(2)该食品包含的每种营养成分对人体健康的重要性(类比多因子模型中的λ)。因此,虽然食物种类五花八门,但归根结底它们都可以归结为不同营养成分的组合;同理,虽然股票资产的组合形式成百上千,但归根结底它们都可以归结为不同因子的组合。这就是因子的作用和多因子模型的价值。
从上述定义可以总结出因子需要满足的两个必要条件:(1)因子驱动了资产收益率的共同运动(co-movement),因此因子一定和资产收益率的协方差矩阵有关;(2)从长期来看因子是可以获得正收益的,这意味着因子必须是被定价的。明确了因子的定义,下面再来看看什么是多因子模型。
把若干个因子放在一起使用就构成了一个多因子模型,它们对应着式(1.3)中的部分。通常来说,人们总可以找到非常多的能够解释资产预期收益率截面差异的因子,但无论是学术理论还是投资实践都表明并不应该把所有的因子都放到一个多因子模型里。如何确定一个多因子模型中到底有几个以及哪些因子,可以从以下两点考虑。首先,很多因子之间都存在一定的相关性,高度相关的因子代表的是资产收益率所暴露的同一类风险。在选择模型包括的因子时,必须要考虑相关性的影响,人们希望加入模型的因子是相互独立的、每个因子都能对解释资产预期收益率截面差异有显著的增量贡献。其次要考虑简约法则(The Law of Parsimony)。从定义出发,每个因子代表的是资产暴露的某种共性风险。因此从常识来说,多因子模型中因子的个数一定是有限的[4]。学术界的主流多因子模型通常包括3~5个因子,本书的第4章将对这些模型进行系统的阐述。
最后来看异象。在选定了多因子模型后,如果按照某个特征构建的多空组合的预期收益率中存在一部分无法被多因子模型解释,且这部分显著大于零,那么该资产就是一个异象。举个例子,在股票市场中,人们经常根据某个公司财务指标或者量价指标来把股票排序,并按照排序高低构建一个多、空对冲投资组合。将该投资组合作为一个资产放在多因子模型中,如果其αi显著大于零,那么就称该投资组合为一个异象,而构建该组合的指标就被称为异象变量(anomaly variable)。
1.1.3 再论异象和因子
1.1.2节从式(1.3)出发探讨了因子投资中的三个部分:因子、多因子模型和异象。下文将围绕这三部分,从学术界和业界各自的立场来讲述因子投资的内容。不过在那之前,本节想花一点笔墨说明一下学术界和业界对异象和因子看法上的差异,这将有助于下文介绍因子投资的内容。
在因子投资的术语中,无论是式(1.3)中αi代表的异象还是代表的因子往往都被称为因子。为了区分它们,只需要记住是一个定价模型,因此它包含的因子又被称为定价因子(pricing factors);而αi代表的是按某种方法构建出的能够获得多因子模型无法解释的超额收益的资产,因此它又被称为异象因子(anomaly factors)。在本书中,如无特殊说明,当谈及异象时,指的就是αi代表的部分;当谈及因子时,指的则是定价因子的部分。
在因子投资中,学术界往往更加严谨地区分异象因子和定价因子。由因子的定义可知,它必须能够解释资产预期收益率截面上的差异。经过几十年的发展,学术界已经从上市公司财务指标和股票交易中的量价指标中找到了上百个满足上述要求的因子。然而,从1.1.2节的论述可知,一个多因子定价模型应满足简约法则,这意味着定价因子个数是有限的。为此,学术界往往从经济学和金融学的原理出发,从大量相关的因子中找到有限个相对独立的因子构成多因子模型,而把其他没有被加入模型中的、能获得模型无法解释的超额收益的因子都视为异象。反观业界,无论是管理人还是投资者,他们往往不严格区分异象因子和定价因子,而把它们统称为因子。业界往往更关心因子能否获取定价模型无法解释的超额收益,因为这代表着构建因子的变量可以区分高收益股票和低收益股票,因此人们可通过买入高收益股票而“战胜市场”。理解了学术界和业界对定价因子和异象因子看法的差异后,接下来就来看看因子投资包含哪些内容。
1.1.4 因子投资包含的内容
因子投资的内容可以因研究的对象是式(1.3)右侧的或αi而分成两大类。每一大类下又可以因站在学术界和业界的不同立场再进一步划分。按照重要性的先后顺序,首先来看这部分。
1. 关注于的研究
对于,学术界关注的是找到“最好”的多因子模型“最好”通常意味着在该模型下资产的αi尽可能接近零,即该模型无法解释的异象越少越好。以此为目标,学术界在过去30年针对股票市场推出了很多经典的多因子模型。在提出每个多因子模型的同时,学术界也格外关注每个因子背后的原因。即便到了今天,因子背后的原因也仍然是研究的热点之一。经过几十年的发展,学术界也发明出很多计量经济学的方法,它们可以计算因子暴露、因子收益率并对多因子模型进行假设检验。除此之外,学术界研究的另一个重点是对主动基金管理人的业绩进行归因。大量的实证数据研究表明,在选择了适当的多因子模型后,绝大多数主动基金管理人并不能获得超额收益。
与学术界不同,业界进行因子投资最重要的目标是使用因子来获取超过基准的收益[5]。因此业界从资产配置的角度聚焦于找到从长期来看有风险溢价的因子(即λ大),并以尽可能高的暴露(即βi高)配置在这些因子上。仍然以Ang(2014)中食物和营养的类比做解释。人们每天摄入不同的食品,其本质是为了吸收食品背后的营养成分,这些食品只是获得营养的渠道。人们想要保持健康则需要这些营养成分均衡的搭配。回到因子投资中,业界关心如何以资产为媒介配置在不同的因子上,并在分散化的前提下最大化在不同因子上的暴露,从而获得稳健的(超额)收益。除此之外,随着因子投资的发展,很多Smart Beta ETF金融产品相继问世,极大地丰富了资产配置的工具。
2. 关注于αi的研究
再来看αi部分。αi代表了可以通过套利获得的超额收益。出于截然不同的原因,学术界和业界都对它非常感兴趣。先说学术界,从有效市场假说(Efficient-Market Hypothesis,出自Fama 1970)的观点出发,如果多因子模型不存在模型设定偏误,那么市场中不应该存在太多异象。因此,一旦一个异象被发现,就会被拿来评判市场并非有效,或用来描述市场均衡状态的因子模型有误,这是学术界研究异象的主要动机。另外,解释异象的能力是评价多因子模型优劣的重要标准之一。比如两个多因子模型A和B,如果使用模型A时异象的个数少于使用模型B时异象的个数,就会认为模型A比模型B更好。模型之间的对比也从侧面推动了对异象的研究。
相比之下,业界对异象的研究动机则“单纯”得多。正如1.1.3节所描述的那样,业界并不严格区分定价因子和异象因子。在业界看来,一个因子是否被纳入某个定价模型(从而从异象因子转变为定价因子)并不重要,而更关心在考虑了交易成本之后,使用该因子是否仍然能够获得超额收益。
3. 截面角度vs时序角度
目前,在关于因子投资内容的介绍中,无论研究的关注点是还是αi,它们都是在给定的因子模型下研究资产的预期收益和βi之间的关系,即资产预期收益率在截面上的差异,因此多因子模型是关于均值的模型(model of the mean)。从数学定义可知,预期收益率是收益率在时间序列上的平均,因此均值的模型仅关心不同资产的收益率均值为什么会有差异,而非每个资产的收益率如何随时间变化。把式(1.3)沿时间轴展开,资产超额收益和因子收益率在时序上满足如下多元线性回归模型:
其中表示t时刻资产i的超额收益,λt表示t时刻因子收益率,εit表示t时刻的随机扰动。这就是研究多因子模型的时间角度。图1.2展示了截面角度和时序角度之间的切换。
图1.2 截面角度vs时序角度
在时序角度下,因子投资中的两个重要问题是方差模型(model of the variance)和因子择时。为了解释前者,把N个资产的时序多元回归模型放在一起表达:
其中是N维超额收益向量;α=[α1, α2, ···, αN]′是N维定价误差向量;β=[β1, β2, ···, βN]′是N×K因子暴露矩阵;εt=[ε1t, ε2t, ···, εNt]′是N维随机扰动向量,满足E[εt]=0以及cov(λt, εt)=0。对式(1.5)两侧求协方差矩阵并利用cov(λt, εt)=0可得:
Σ=βΣλβ′+Σε (1.6)
其中Σ(N阶矩阵)、Σλ(K阶矩阵)以及Σε(N阶矩阵)分别为N个资产的协方差矩阵、K个因子的协方差矩阵以及N个随机扰动的协方差矩阵。由于εit相互独立,因此Σε是一个对角阵。式(1.6)就是关于方差的模型。
从学术界的立场来看,式(1.6)意味着因子必须和资产的协方差矩阵有关,而这也正是1.1.2节中关于因子需满足的两个必要条件中第一个条件的出处。值得一提的是,当下学术界流行的所有主流多因子模型(本书第4章会详细介绍)要么来源于金融学或经济学原理,要么来源于自行为金融学的启发,但它们都没有直接从式(1.6)传达的因子协方差矩阵和资产协方差矩阵的关系入手。一个多因子模型代表着资产超额收益的某种结构,因此一个好的模型应该尽可能解释不同资产收益率间的共性运动。这反映到式(1.6)上就是模型中因子的选择应使得βΣλβ′尽可能接近资产协方差矩阵Σ的非对角线元素。但无论是经典的Fama–French三因子模型(Fama and French 1993)还是当下热门的Hou–Xue–Zhang四因子模型(Hou et al.2015)等,均没有对此给予充分的考量。在最新的研究中,Pukthuanthong et al.(2019)指出了这种关联的重要性,并以此为依据提出了一个甄别真正因子的框架。可以预期,从式(1.6)出发找到真正的因子、构建多因子模型将会是学术界未来的一个研究重点。
再来看看业界。业界对于式(1.6)的关注和学术界有所不同,而是基于风险控制这个非常现实的考量。在投资中,一个很重要的风险指标是投资组合的波动率。投资组合的波动率由其包含的资产在组合中的权重、资产收益率的方差以及资产收益率之间的协方差决定。因此,计算投资组合的波动率就必须知道资产之间的协方差矩阵。从数学上说,如果使用历史收益率序列计算样本协方差矩阵,那么历史数据的期数T需满足T≥N,否则用历史数据估算出的样本协方差矩阵就是不可逆的[6]。当资产个数N很大时,要求T≥N是不切实际的。然而,如果把资产的收益率通过多因子模型转化为因子的收益率,则可以大大简化上述问题。
在多因子模型中,因子的个数K往往远小于资产的个数,因此使用多因子模型分析资产收益率相当于一种降维处理。式(1.6)通过多因子模型把求解N阶的协方差矩阵巧妙地转化为求解K阶因子收益率的协方差矩阵。有了因子协方差矩阵,利用资产和因子收益率之间的线性关系就可以反推出资产收益率的协方差矩阵并进行风险控制,这种做法在投资实务中有巨大的价值。在海外的大机构中,使用多因子模型计算资产协方差矩阵并进行风险控制的有很多,但其中最著名的大概要数Barra多因子模型[7]。以Barra最新一代的中国股票多因子模型CNE6为例,它使用1个国家因子、9个风格因子以及一系列行业因子来刻画A股市场上超过3000支股票的收益率,极大简化了股票协方差矩阵的求解。在过去好几代多因子模型中,Barra开发了一系列统计学方法,逐步提高了协方差矩阵估计的准确性。
时序角度的另一个研究重点是因子择时。与截面角度只关心因子的预期收益率不同,在时序角度,人们关心的是因子收益率如何随时间波动。由因子的定义可知,因子代表了资产共同暴露的某种系统性风险,而长期大于零的因子溢价正是对该系统性风险的补偿。这说明每个因子的收益率在时间序列上是有波动的,有时收益高,有时则面临亏损;且不同因子的收益率在不同宏观经济周期对应的市场环境中表现也是不同的。在这方面,学术界通常关心的是不同因子和宏观经济以及投资者情绪之间的关系。而反观业界,由于业界使用因子的目的是进行资产配置和获取超额收益,因此自然会对因子收益率在时序上的变化产生极大的兴趣。这是因为如果能够通过择时来挑出某个因子“好使”的时候配置、在它“不好使”的时候规避,那么无疑会提高使用因子的风险收益水平。正是在这个动机的趋势下,因子择时始终是业界的研究热点之一。
4. 统一视角
以上从式(1.3)出发,从、αi以及“截面角度vs时序角度”三个维度梳理了因子投资中所涉及的内容。这也正是本书希望传递出来的统一视角下的因子投资。图1.3对这三个维度进行了总结,它可以被视作全书的思维导图。
1.1.5 实证资产定价与因子投资
严格地说,在1.1.4节涉及的内容中,学术界视角下因子投资的内容属于实证资产定价研究的范畴;而一般当人们谈论因子投资的时候,通常指的是业界的视角。然而,出于以下两个原因,本书提倡把学术界和业界关注的不同内容放入统一的视角,学习和实践因子投资。
首先,投资学大概是学术界和业界结合的最紧密的学科之一,而因子投资则是这种紧密结合的代表。经过了几十年的努力,学术界在实证资产定价方面提出了丰富的金融理论模型和计量经济学统计手段,并发现了诸如价值、盈利、动量、低波动等如今已被广泛认可和接受的因子。这些发现自问世以来就持续地指导着因子投资实践。毫不夸张地说,因子投资的兴起深深地植根于学术界关于资产定价的研究中。另外,业界的因子投资活动也为已有理论的反复检验和新理论的提出提供了充足的数据,促使学术界不断提出新的研究成果。
图1.3 统一视角下的因子投资
其次,作为一个理论指导实践的细分学科,虽然历经了几十年的发展,但因子投资依然在不断地完善和创新。最初,多因子模型仅是在人们拒绝了CAPM之后的代替之选,其后它逐渐发展成为股票投资的有效手段之一。时至今日,多因子模型早已渗透到不同大类资产的投资中,人们在股票、债券、商品期货甚至是加密币领域都可以看到它大展身手。在当下最新的趋势中,人们更是从因子的角度对不同类资产收益率的底层驱动因素和逻辑进行分析,使用因子进行跨类别的大类资产配置。对因子投资的实践者来说,只有了解已有的各种研究方法,才能更好地迎接和拥抱因子投资未来的发展和变革。
基于上述两个原因,本书作者认为掌握学术界的研究成果对于培养正确的因子投资科学观至关重要。而将学术界的方法论和业界的实践相结合,依照图1.3勾勒出的统一视角系统地解读因子投资则是本书最重要的特色。在后面的第2章到第7章将会对这个框架下的不同部分进行探讨。在那之前,接下来的1.2节和1.3节先从学术界和业界的角度梳理一下因子投资的起源和发展,1.4节介绍本书的结构和写作目标。
最后需要指出的是,虽然因子投资如今已被应用于各类资产,但相比于其他类别的资产,它在股票市场上的应用无疑是压倒性的。当人们谈到因子投资时,也往往默认是股票市场。这背后的原因是股票是最重要的一类资产,而因子投资的发展也源自学术界对股票市场的研究。为此,本书将完全针对股票市场阐述因子投资的方方面面。感兴趣的读者也可以尝试将本书介绍的方法论应用于其他资产。
[1]CAPM由Treynor(1961, 1962),Sharpe(1964),Lintner(1965a, 1965b)以及Mossin(1966)分别独立提出。公众号“川总写量化”的文章《CAPM的一小段历史》对其进行了介绍。
[2]预期收益可用来描述各类资产提供给投资者的期望回报,包括但不限于股票、债券、大宗商品、房地产等。而对于本书关注的因子,学术界往往更习惯将因子的预期收益称为因子溢价。本书中会交替使用“因子预期收益”和“因子溢价”这两种称谓来指代因子的预期收益。
[3]金融市场中通常使用α代表资产相对于某基准的超额收益。
[4]如果一共有N个资产,那么总可以使用这N个资产作为“因子”来完美地解释它们预期收益率的差异。但这么做毫无意义。
[5]以股票市场为例,市场指数就是基准,而因子投资的目标是使用不同的因子获得比市场收益率更高的收益。
[6]协方差矩阵应是可逆的。在投资组合优化中,协方差的逆矩阵经常出现在资产最优权重的表达式中。因此,当使用样本协方差矩阵作为协方差矩阵的估计时,如果因T<N造成样本协方差不可逆,就会使得投资组合优化不可解。除此之外,即便T≥N成立,仍需考虑使用样本协方差矩阵作为协方差矩阵的估计的准确性的问题。Ledoit and Wolf(2003)指出,通常T需要比N高一个数量级才能保证估计的准确性。在实际的资产配置中,T比N高一个数量级几乎是不可能的。
[7]Barra如今已经被MSCI收购,但依照惯例业界仍然使用Barra多因子模型这个叫法。