1.2 本书的特点
本书主要针对已经修读过基础社会统计学课程或者具有一定统计学基础知识的学生或研究者,希望读者通过学习本书能够对社会科学中回归模型的理论和实际操作有更全面、更深入的了解。除了讲解统计理论外,本书还将结合具体问题,利用统计软件,指导读者如何利用这些方法解决实际研究问题。本书具有两大特点:第一,除了对经典的多元回归模型进行比较深入的讲解外,对一些重要的、非经典的回归模型也进行了扩展和补充;第二,不是仅仅停留在理论层面,同时更强调实际操作的重要性。在大部分章节中我们都会使用实际研究数据,通过实例分析和相应的Stata程序来讲解统计知识在研究中的应用以及对数据研究结果给出阐释。在数据使用上,我们选用了1988年和1995年两次中国居民收入调查(CHIP)数据,1990年美国综合社会调查(GSS)数据,1998年、2000年、2002年和2005年“中国老年人健康长寿影响因素调查”(CLHLS)项目数据,以及1972年美国高中毕业生有关职业选择问题的调查数据。其中,使用最多的是1988年中国居民收入调查(以下简称CHIP88)数据中城市居民的部分。
CHIP88数据来自1988年由中国社会科学院经济研究所主持的“中国居民收入分配”调查。它是中国改革早期较具规范性的社会调查数据,因此在中、英文文献中被广泛采用。CHIP88包括两个部分:一个是针对城市居民的调查,另一个是针对农村居民的调查。此次调查采用分阶段抽样的方法:先从30个省级行政单位中抽选出10个省份,然后再从这10个省份的434个城市中抽选出55个城市作为代表。城市部分的调查在1988年3 ~4月进行,共调查9009户,调查问卷收集了每一户中所有家庭成员的资料,包括其基本情况、受教育情况和就业情况。在删除缺失数据和不完整观测个案之后,总共得到15862条居民个体的观测数据。
在本书中,我们统一使用Stata 9.0作为示例数据的统计分析软件。由于算法和默认设定上可能存在的差异,采用不同软件和同一软件的不同版本对复杂模型进行参数估计所得的结果可能会存在细微差异。