第一节基于股指期货推出时点分段实证方法选择与样本数据说明_股指期现货市场关系：中国内地与海外市场比较-QQ阅读男生轻小说网

上QQ阅读APP看书，第一时间看更新

第一节基于股指期货推出时点分段实证方法选择与样本数据说明

一实证方法选择与样本数据说明

（一）实证方法选择

除依据价格走势图对股指期货推出前后的现货市场价格趋势进行定性描述外，大多数定量研究采用了统计检验和模型实证分析方法。如本章第一部分所述，研究结果对样本长度及区间较为敏感，并与所采用的实证或统计方法也有紧密关系，而产生这些问题的关键是波动率估计。结论的说服力往往体现在波动率估计的问题上，而目前关于波动率估计的计量经济研究结论指出各种波动率估计方法各有优劣，因此，较好的解决办法就是多方法的灵活应用与比较。

金融资产是收益与风险的统一体，现代金融对资产收益的衡量一般使用收益率，对风险的衡量使用波动率。波动率是收益率的变动特征或收益率相对于其期望值的变动特征及其变动发生的可能性，从统计学上描述金融资产的收益率变动，就是探寻收益率变化的分布特征，而精确地描述这种分布特征几乎是不可能的，因此，人们通常用收益的4个矩来描述，即一阶矩收益率期望值、二阶矩波动率、三阶矩偏度和四阶矩峰度。相对于金融统计研究概念，人们对资产波动性的理解是多种多样的，有定性的描述，如上涨或下跌即趋势的走势；有的将其简单定义为收益率的方差或标准差；有的视其为某段时期内的价格最大值最小值变动关系；有的更进一步考虑到方差的时变特征将其发展为条件方差；有的将其视为收益率变动的平方等。对波动率的争论与研究从未停止过，随着现代计量经济技术、统计技术以及信息技术的发展而发展。当然，这也是金融领域涉及波动率相关问题的研究一直存在分歧的一个主要原因。本书在对波动率的估计及分析上，尽量综合考虑上述所及的波动率概念及分析方法，使分析结论更具说服力。

总结已有文献，本书对股指期货推出对现货市场价格波动影响的实证研究方法分为三类：波动率变化的统计检验、波动率模型分析、市场走势分析。以下分别讨论这三类方法。

（二）波动率变化的统计检验

本方法相对直观，首先选择波动率的估计方法对股指期货推出前后的子样本区间分别进行波动率估计，然后对股指期货推出前后的波动率进行相等性统计检验从而得到结论。

1．收益率的计算方法

考虑到对数收益率的良好统计性质，本书将股指期货合约价格或股票现货指数价格收益率定义为对数差分收益率除有特殊说明，本书所有收益率定义均与本章定义一致。。股指期货合约价格收益率：

其中，Rift为股指期货合约价格在t时刻的收益率，Pift为t时刻股指期货合约的价格，Pift-1为t-1时刻股指期货合约的价格。t可根据价格样本频率设定，可以是日、5分钟、1分钟等。

股票现货指数价格收益率：

其中，Rsit为股票现货指数价格在t时刻的收益率，Psit为t时刻股票现货指数的价格，Psit-1为t-1时刻股票现货指数的价格。t可根据价格样本频率设定，可以是日、5分钟、1分钟等。

2．波动率估计方法

各种关于波动率的估计方法都有优劣，本书的主要目的不是比较这些波动率估计方法的优劣，也不试图探寻精准的波动率估计方法，目的是尽可能地将多种方法估计的波动率结果呈现出来，以提升关于股指期货推出对现货市场影响结论的说服力。

目前，对金融资产波动率估计的方法主要有四类。第一类是现在常用的历史波动率模型方法。这类波动率模型是基于收益率历史数据构建的，并且这些历史收益率数据都为低频数据，如日数据、周数据及月数据等。“具有代表性及最为常见的历史波动率模型有自回归条件异方差模型（ARCH）、广义自回归条件异方差模型（GARCH）及随机波动模型（SV），随机波动模型在波动率处理上较ARCH模型具有更好的表现。” 徐正国、张世英：《调整“已实现”波动率与GARCH及SV模型对波动的预测能力的比较研究》，《系统工程》2004年第11（8）期，第60～63页。第二类是基于期权定价模型及数据的隐含波动率模型方法，期权价格包含了市场波动的信息，因此，在知晓期权的准确出清价格的基础上，就可以利用期权定价模型估计波动率。而此方法建立在正确设定期权定价模型的基础上，同时要求期权市场具有较高的成熟度，因此，限制了该方法的使用范围。第三类波动率估计方法是非参数的“已实现”波动率（Realized Volatility）估计法，Andersen和Bollerslev（1998）指出，使用基于日内高频收益数据的已实现波动率（RV）作为波动率的测度，由于高频数据包含更为丰富的波动信息，因此，可以大大降低低频数据对波动率的测量误差及噪声，体现真实潜在的波动过程，而且随着数据频率的增加，这种测量误差将会越来越小，因此，RV方法提供的波动率估计结果更为精确详见张世英、许启发等《金融时间序列分析》，清华大学出版社，2008，第202～208页。。但由于市场微观结构效应（如不同步交易、闭市效应等）的影响，RV方法同样存在误差。第四类方法是基于极差的波动率估计方法。最具代表性的就是Garman和Klass（1980）提出的利用开盘价、收盘价以及最高价、最低价构建的估计方法，由于Garman-Klass波动率估计方法考虑了开收盘价及最高最低价，因此，包含了比其他方法更多的信息，且研究表明Garman-Klass估计量的误差更小，估计结果更为有效（Parkinson, 1980；Wiggins, 1992），但其也存在受微观结构效应影响的问题。同时，从样本数据使用频率上看，“维数灾难”的存在使得传统ARCH、SV类模型对高频数据难以获得参数的正确估计关于高频数据波动率估计问题的理论及模型描述还可参考张世英等编写的《协整理论与波动模型——金融时间序列分析及应用》第356～377页的内容。，因此，对高频数据波动率的估计较为精确的方法为调整“已实现”波动率估计，以及Garman-Klass波动率估计。

结合国内外当前研究的成果和以上描述，本书选择ARCH类模型虽然随机波动模型（SV）在波动率处理上较ARCH类模型具有更好的表现，但在低频数据的使用范畴内，这种差别在应用于不同市场价格波动率的比较上不大，同时考虑到操作的便利性，本章将在下节利用ARCH类模型并加以拓展来进行研究。、调整RV（ARV）波动率估计以及Garman-Klass波动率估计方法作为波动率的基础估计及研究方法除有特殊说明，本书所使用的波动率相关概念和界定以本章描述为准。。在本小节只具体列出波动率变化统计检验所使用的波动率估计方法，即ARV方法和Garman-Klass方法，而ARCH类模型研究法将在下一小节中具体列出并分析。

（1）ARV方法。Andersen和Bollerslev（1998）定义：第t天资产收益率的已实现波动率RVt的估计为第t天内所有高频收益率的平方和，即：

其中，rt, n为资产在第t日内的第n个高频收益率，即：

其中，n=1, 2, 3, …, N, N为日内交易时段等时间间隔的采样次（个）数，如使用5分钟等间隔高频数据，日内共交易4小时30分钟，则N=54，如使用其他频率数据，方法依此类推。

Hansen和Lunde（2006）建议由于交易并非24小时连续进行，因此，应考虑闭市效应而使已实现波动率更为精确地描述真实的波动性，为此，他们建议用尺度参数来调整RVt，尺度参数为λ，将RVt经λ参数调整为调整后的ARVt，即本处设定参考了魏宇《沪深300股指期货的波动率预测模型研究》，《管理科学学报》2010年第13（2）期的相关研究。：

其中，

其中，D为样本天数，如使用了500天的数据，D=500, rt为日收益率，在本节中即为：

本书使用调整已实现波动率ARVt作为股指期现货价格已实现波动率的度量。

（2）Garman-Klass方法。根据Garman和Klass（1980）的研究，定义 σ（GK）t 为t时刻资产的Garman-Klass标准波动率这里使用“标准”一词的原因是国内大量研究对Garman-Klass标准波动率估计公式进行了简化，而本书使用其原型。参见Garman和Klass（1980）和Wiley和Daigler（1999）的相关描述。。Garman-Klass标准波动率估计模型为：

其中，Ht为t时刻最高价，Lt为t时刻最低价，Ot为t时刻开盘价，Ct为t时刻收盘价。以下简称GK波动率。

3．波动率统计检验方法

在所选择的波动率估计方法基础上，以股指期货推出日为分界点，对股指期货推出前后一段时期的股票现货市场数据子样本分别进行波动率估计，然后进行相等性检验。

相等性检验一般包含均值、中位数及方差的相等性检验。常用方法包括基于正态分布假设或方差相同的t检验、F检验、Siegel-tukey检验和Levene检验及其扩展方式等。同时，随着统计技术的发展，对数据分布假设的放宽，产生了非参数检验方法。后者较前者而言，结论的稳健性有了较大提高，避免了对总体分布过于主观的假设而导致的重大错误。常用的非参数检验包括Mann-Whitney U检验、Kolmogorov-Smirnov Z检验、Wald-Wolfowitz runs检验、Moses Test of Extreme Reactions检验。在样本数据的统计描述前提下，选择适合的相等性检验方法。

在收益率均值相对性检验以及上述波动率相等性检验中，除使用传统的t检验外，根据统计描述，本书同时选择使用非参数Mann-Whitney U检验、Kolmogorov-Smirnov Z检验本书其他章节使用非参数检验方法均以此处描述相同，参考了薛薇《基于SPSS的数据分析》。。这里只简要介绍各非参数检验原理便于对后文实证内容的理解。

Mann-Whitney U检验是在总体分布未知的前提下，假设两样本总体分布相同，检验两样本中位数是否相等，从而判断两样本总体分布是否相同，其原假设为：两样本中位数相等。

Kolmogorov-Smirnov Z检验同样是在总体分布未知的前提下，通过检验两个样本是否属于统一理论分布，来判断两样本的秩是否相等，进而推断两样本是否相等，其原假设为：两独立样本总体分布相同。

上述非参数检验，通过判断各统计量是否超过临界值或通过统计量的相伴概率，推断显著性。

在收益率序列分析中，补充选择了BFL法进行方差相等性检验，以对波动率变化进行分析。Brown和Forsythe（1974）对Levene检验进行了改进得到Brown-Forsythe-Levene法（以下简称BFL法）详见高铁梅等《计量经济分析方法与建模——EViews应用与实例》，清华大学出版社，2009，第2版，第26页的描述。。Conover、M. E. Johnson和M. M. Johnson（1981）比较了检验方差相等的15种方法，发现Brown-Forsythe-Levene法的检验结果是最好的，其不要求收益率服从正态分布，相比普通F检验等其他方法与实际情况更为接近。目前这种检验收益率方差相等的方法已经被广泛应用于金融市场众多领域。同时，为便于比较，本书还进行了收益率方差F检验以及波动率均值检验，虽然这些方法在同方差假设上显得较为粗糙。

（三）波动率模型分析方法

本书采用GARCH类模型对股指期货推出前后的现货市场价格波动率进行分析，GARCH类模型现已成为低频数据金融时间序列较为成熟的分析方法，对其原理在此不再赘述。本书也不再拘泥于其传统应用，而是对其进行一定的改进，并充分从GARCH类模型的变形中挖掘更多的信息，以充分说明股指期货推出对现货市场波动性的影响。

本书使用GARCH类模型的目的有两个。一是为通过对GARCH模型中的条件方差方程进行一定的改进，从而使用低频数据分析股指期货推出前后现货市场价格波动率变化与否的问题，这一步是对上一小节的一个补充，主要基于低频数据的利用和与高频数据研究结论的比较来完善结论。第二个目的是通过GARCH模型的变形形式充分挖掘现货市场微观结构的变化信息，以说明股指期货推出对现货市场价格形成的微观结构所产生的影响。这一步是基于微观结构理论关于信息的描述内容的实证，因为波动率包含了大量信息，波动率的变化反映了市场对信息的处理效率，信息冲击反过来必然会对波动率产生影响。股指期货的推出给现货市场带来一系列的信息冲击，股指期货市场推出是否使现货市场价格反应信息的效率发生改变，从而反过来说明股指期货市场推出对现货市场价格波动的影响，可以证明如股指期货市场推出提高了现货市场定价效率等一系列假说。这些理论都可以通过非对称的GARCH模型中的参数定义及估计结果得到一定的解释。

1．基于Chow间断点检验思想的GARCH模型改进

Chow检验的基本方法为本书GARCH模型改进提供了思路。Chow分割点检验的思想是把模型应用于由分割点划分出来的每一个子样本区间，然后比较利用全部样本进行回归得到的残差平方和与利用每一个子区间样本所得到的加总的残差平方和，从而判断是否发生了结构变化高铁梅等：《计量经济分析方法与建模——EViews应用及实例》，清华大学出版社，2009，第2版，第85页。对ARCH类模型的描述大多引用了该文献的相关内容。，常用F统计量和对数似然比统计量进行检验。而在模型中对分割点前后数据加入虚拟变量进行区分（分割点前赋值为0，分割点后赋值为1），Chow检验的统计量就转化为对虚拟变量系数显著性的t检验。如果虚拟变量系数显著，表示股指期货推出前后现货市场价格波动率存在差异。如果虚拟变量系数显著为正，表示股指期货推出后现货市场价格波动率增大；如果显著为负，则表示股指期货推出后现货市场价格波动率减小。本书使用这种思路，在GARCH模型的条件方差方程中加入虚拟变量，区分股指期货推出前后的波动率数据，检验股指期货推出是否对现货市场价格波动性产生了影响。以GARCH（1, 1）模型 GARCH（1, 1）是根据Nelson（1992）经过反复试验确定的，该模型已有很强实用性，详见莫扬（2004）《股票市场波动性的国际比较研究》的结论。为例具体阐述如下。

条件方差方程为：

其中，ω为常数项，一般为平均波动水平；ε2t-1为均值方程扰动项平方的滞后项（ARCH项）；σ2t-1为上一期的预测方差（GARCH项）。均值方程设定将在后文具体阐述。

改进的条件方差方程为：

其中，D为虚拟变量，，在非对称GARCH模型中也可加入虚拟变量，系数均为 θ，以下不再赘述。

2．非对称GARCH模型的选择和使用方法

如前文所述，考虑到对股指期货推出前后现货市场价格对信息反映变化的研究，又因为大量研究表明股票市场价格对利好利空消息反应存在非对称效应（杠杆效应），而这种杠杆效应的变化与否可以反过来揭示市场价格对信息反应效率的变化。非对称GARCH模型较好地描述了杠杆效应，因此，本书使用其进行研究。

较为成功的非对称GARCH模型是Zakoïan（1990）和Glosten、Jagannathan、Runkle（1993）提出的TARCH模型和Nelson（1991）提出的EGARCH模型。本书也选择这两种模型进行实证。对两个模型具体描述如下。

相对于GARCH（1, 1）模型，TARCH（1, 1）模型的条件方差方程设定为：

除等式后第三项外，其他各项定义均与GARCH（1, 1）模型相同，dt-1为虚拟变量，当εt-1＜0时，dt-1=1；否则，dt-1=0。如果γ≠0，表示非对称效应存在。γε2t-1dt-1项就为非对称项（TARCH项）。方程表明σ2t与前期的残差平方ε2t-1和条件方差σ2t-1的大小相关。利好消息（εt-1＞0）和利空消息（εt-1＜0）对条件方差的影响不同，利好消息有 α 倍的冲击，即 εt-1＞ 0时，dt-1=0，方程中的TARCH项不存在，因此，利好消息只有α倍的冲击；而利空消息则有（α +γ）倍的冲击，因为当εt-1＜ 0时，dt-1=1，方程中的TARCH项存在，因此，利空消息会带来（α+γ）倍的冲击。如果γ ＞ 0，说明非对称效应（杠杆效应）存在，该效应使得波动上升；如果γ ＜ 0，非对称效应使得波动下降。

相对于GARCH（1, 1）模型，EGARCH（1, 1）模型的条件方差方程设定为参见高铁梅主编《计量经济分析与建模——EViews应用及实例》，清华大学出版社，2009，第2版，第205～209页。：

方程左边的条件方差为对数式，说明杠杆效应是指数的，而不是二次的，因此，条件方差一定是非负的。α + γ大小度量冲击对波动的影响，其值越大意味波动对信息冲击反应越敏感。γ值代表非对称效应，同样，利好消息（εt-1＞ 0）和利空消息（εt-1＜ 0）对方差方程有不同影响，若γ ＜ 0, α -γ倍利空消息冲击比α +γ倍利好消息冲击要大，即存在非对称效应（杠杆效应）；若γ ＞ 0，利空消息冲击减少波动，而利好消息冲击加大波动；若γ =0，利空、利好消息冲击作用相同，只为α倍。β就是GARCH项，β大小代表波动对信息冲击的记忆性和持久性特征，也即“旧信息”对当前波动率的影响，相对而言，α 或α +γ就是经过过滤的有用新信息对当前波动率的冲击。相比GARCH模型，EGARCH模型无须施加任何限制，使方程求解过程更为简单与灵活。

3．均值方程的设定

在ARCH类模型设定中，均值方程设定形式相对灵活，可以为AR模型、MA模型或是一般的回归模型等。一般在合理选择AR模型滞后阶数下，AR模型可以较好地描述金融时间序列变量的动态变化路径，而MA过程是将证券价格时间序列写成一系列不相关的随机变量的线性组合，通常MA过程可以清楚地考察随机冲击因素（AR模型残差项的滞后项）对证券价格当前值的影响，故在大量实证研究中，经常用MA过程来分析一些无法具体定义的随机扰动因素对金融（证券）价格时间序列的影响情况。因此，考虑到证券市场价格变化的影响因素，除证券价格自身所包含的信息外，还包括收入、波动溢出，市场预期，政策制度等其他因素的影响，此处将GARCH类模型的均值方程设定为ARMA过程形式，即股票现货指数收益率ARMA（p, q）模型：

其中，c为常数项；为AR项；为移动平均项；p和q为滞后阶数，须在估计前进行定阶分析；φi和ηj为待估计参数。

在上述GARCH类模型的基础上，首先，对加入条件方差方程的虚拟变量系数的显著性进行检验，并从系数估计结果判断波动率的变化方向。其次，分别估计股指期货推出前后现货指数子样本的非对称GARCH模型，从模型方差方程系数变化判断挖掘微观结构变化信息。最后，考虑到论述的严谨性，在用上述模型分析前，需对样本收益率序列进行ARCH效应检验；又由于GARCH类模型是基于平稳时间序列进行分析的，还需进行单位根检验；还必须对ARMA模型定阶进行具体说明，在模型估计后还需对ARCH效应再检验等。这些模型前后期工作应用较为成熟，在此不做详细讨论。

（四）市场走势分析方法

本部分直接使用价格走势图进行定性分析，将样本数据直接通过统计软件生成走势图进行。

（五）样本数据说明

中国大陆股指期货市场指由沪深300股指期货各月合约构成的市场，现货市场在本书中特指沪深300股指期货合约标的物指数沪深300指数实际股票现货市场的概念范畴比本书所表述的大得多，还应包括成分股、非成分股、现货组合、现货组合合约（如ETF）、其他类别指数等，沪深300指数因为是期货合约标的物，因此，具有特殊代表性，但更细致、深入的研究应针对上述现货市场概念所包含的各部分展开相关研究，故这也是本书的一个不足及有待发展的地方。；本章与以后各章中，中国大陆和海外市场样本的实证结论比较除具体描述外均简称为中外比较。

本章用于比较的其他海外市场样本与之后各章有所不同。其一，因为实证方法除非参数检验较少使用外，国内外大多数已有关于股指期货推出对现货市场波动影响的实证文献方法与本书较为类似，且关于特定市场的结论具有一致性，因此，可以直接引用文献结果与沪深300市场实证结果进行比较，并可以增加比较范围，结果在第二章第一节二节中列出。其二，由于数据可获得性缘故，也无法对所选择的海外样本指数期货推出前后的现货市场表现进行实证研究。这也是本书的一个不足之处。

波动率统计分析中使用的高频数据为股指期货推出前后各一年的沪深300指数日内高频等间隔数据，考虑到采样频率所包含的微观结构效应及噪声的影响，分别使用日内1分钟、5分钟数据做分析，1分钟数据共116160个，5分钟数据共23136个，分别计算高频收益率后，以我国股指期货推出日2010年4月16日作为分割点进行波动率统计分析。同时，考虑到股指期货推出对现货市场价格波动率的长、中、短期影响差异，以我国股指期货推出日2010年4月16日作为分割点，前后15个交易日为短期波动率比较子样本，前后6个月为中期波动率比较子样本，全样本为长期波动率比较样本分别进行对比。GK波动率同时使用低频日数据做比较，进行全样本对比。

波动率模型分析使用沪深300现货指数2006年1月4日至2011年11月14日的日数据，共1425个。使用EViews 6.0、SPSS统计软件进行分析。完整数据来源于中国金融期货交易所，另外高低频数据短期内均为公开数据，可在大智慧股票交易软件及文华财经交易软件中每周下载累积。

二海外市场股指期货推出对股票现货市场波动性的影响结论

在多次总结比较已有文献结论的工作中，发现Gulen和Mayhew（2000）的文献使用了ARCH类等多种模型对已存在的大多数海外股指期货市场的推出影响问题进行了较为全面的研究与总结，方法和本书类似，而且其结论综合了以往大多数文献的结论，具有代表性，并与本章相关问题的大多数分析具有可比性。这为本章工作提供了极大的便利，本章总结补充了Gulen和Mayhew（2000）文章的结论，如表2-1所示，后文与中国市场相关分析结论进行比较而没有再对相关海外市场数据进行重复分析。关于市场走势的问题本章开篇的相关描述已提及，可直接用于比较。

表2-1 世界主要股指期货推出对现货市场波动性的影响

资料来源：Gulen, Mayhew, “Stock Index Futures Trading and Volatility in International Equity Markets”, The Journal of Futures Markets 20（7），2000.

同时，邢天才、张阁（2009）使用GARCH、TARCH、EGARCH模型对A50指数期货推出对中国沪深300指数的影响进行实证研究的结果为轻微加大现货市场波动性；汪冬华、欧阳卫平（2009）统计检验方法对恒生股指期货推出影响的实证结果是降低了现货市场波动性；徐凌、赵昌文（2008）使用统计研究和GARCH模型方法的实证结果表明，国企指数期货推出短期加大了现货市场波动，长期则减小现货市场波动。这些结果都用于本书比较。

本周热推：

商务礼仪与实训国际贸易实务（英文）软文营销：理论、方法、策略与案例分析大变局视角下的中国—拉美经贸合作新零售新终端