三、数据与方法
本研究所用数据来源于风笑天2007年在全国12个城市进行的“城市在职青年发展状况”调查,该调查的对象是“1976年及以后出生的城市在职青年”。该调查采取多阶段按比例分层抽样的方式获取样本。具体而言,抽样过程分三个阶段。第一阶段,分层抽取城市。根据中国城市的区域、类型、规模和社会经济发展水平在东部、中部和西部各随机抽取1个省会城市、1个大城市和1个中小城市;北京、上海和重庆直接选取作为直辖市代表(风笑天,2006b)。第二阶段,随机抽取工作单位。根据城市电话黄页在每个行业等距抽取3—9个工作单位。第三阶段,抽取在职青年。在所抽取单位的帮助下,选取若干(根据行业青年比例以及单位实际规模)1976年及以后出生的青年作为被调查对象,实际调查中尽可能保持性别比例的平衡(风笑天,2009)。
整个调查采取自填式问卷的方式进行,由调查员到被调查者所在单位将问卷发放到被调查者手中,并尽可能按照“集中填答、当场完成、当场检查、当场回收”的方式完成资料搜集。该调查计划在每个城市获取200名各行业在职青年的信息。调查实际发放问卷2460份,最终回收有效问卷2357份。本研究对填答不完全的个案进行了列删(list-wise)处理,最终进入到我们分析的样本为2269人(96.3%)。
调查用直接询问的方式收集了在职青年目前所从事工作是第几份工作的信息:“请问这是你的第几份工作?”但是这一测量已经涵盖了青年工作转换中的多种情况,无论是换职业还是换单位,均在其中。除了直接使用这一变量以外,我们也将这一变量进行变形后形成两个不同的因变量:一是是否有过工作转换。二分变量。1代表有过工作转换,0代表没有过工作转换。这一变量为二分类别变量,我们将在具体的模型拟合中引入二分Logit模型。二是工作转换的次数。这一变量仅仅针对有过工作转换经历的青年,其近似可以看做是定距变量,我们以最小二乘法(OLS)拟合简单线性回归模型。
结合本研究对在职青年工作转换现状与影响因素分析的目的,也参考现有文献的相关设计,以下自变量(集)被引入本研究的分析。一是在职青年的个人相关状况,以便于考察哪些青年在转换工作,这一组自变量包括了性别、婚姻状况、是否独生子女以及受教育状况。性别为虚拟变量,其中男性为参照组;婚姻状况也是虚拟变量,1代表的是已婚,0代表的是不在婚(未婚与离异,样本中以未婚为主);是否独生子女同样是虚拟变量,其中独生子女作为参照组;受教育状况以总受教育年限作定距测量,总受教育年限从被调查者学历转换而来,根据中国实际状况,小学=6,初中=9,高中或中专=12,大专=15,大学=16,研究生=19。
第二组自变量是在职青年的工作状况,包括被调查者的工作年限(工龄),目前所从事行业以及职业状态。工作年限为定距测量,指的是其首次参加工作到被调查时点(2007年)的年数,为了估计工作年限对因变量可能的非线性影响,模型中也引入了工作年限的平方项;行业变量是一个类别变量,包括了生产性行业(如制造业、建筑业)、服务性行业(如批发和零售业、住宿和餐饮业)以及事业机关相关行业(如教育、公共管理和社会组织),其中生产性行业为参照组;职业状态是虚拟变量,0代表正式工,1代表非正式工。
第三组自变量为背景变量,有两个变量。城乡变量测量被调查者在18岁之前主要生活在农村还是城市,其中城市为参照组;所在地区测量被调查者所在城市,为类别变量,分为直辖市、省会城市、大城市和中小城市,其中直辖市为参照组。
最后我们也引入了父母的可能影响,以虚拟变量的形式引入父母是否对被调查者的工作选择有要求,1代表没有要求,0代表有要求。
相关变量的描述性统计见表4-1。从表4-1的前两行中已经可以清晰地看到,在我们的样本中,大约有一半(49%)的青年有过工作转换。而对于那些换过工作的青年来说,其平均的工作转换次数大约为2次(1.92)。下面我们将对青年的工作转换进行进一步的描述与模型拟合。具体的分析将分为三个部分。首先我们对在职青年的工作转换进行继续的深入描述,以期更好地理解青年的工作转换现状与特征。其次,我们以是否有过工作转换为因变量拟合Logit模型来探讨哪些因素影响青年的工作转换。最后,我们针对有过工作转换的青年,拟合线性回归模型来讨论工作转换频率的相关影响因素。
表4-1 变量的描述统计
注:样本量=2269。“换工作次数”只统计有过换工作经历的样本,其样本量=1113。