二、研究设计与资料收集
1. 变量说明
(1)自变量。自变量是生源的城乡差异。改革开放前,由于长期实行“城乡分治,一国两策”,我国的农村地区和城镇地区在经济社会发展各方面都存在较大差距,形成了比一般的发展中国家更严重的“城乡二元经济结构”。改革开放后,维系城乡二元结构的户籍制度、劳动就业制度、分割的教育体系、医疗制度、社会保障制度等政策逐渐向城乡统筹的方向发展,城乡之间的刚性结构逐渐松动,城乡之间的人力与物质流动也在逐渐增加,但农村地区与城镇地区在经济社会发展水平上的较大差距依然存在。可以说,生源的城乡差异是我国大学生群体的一个重要分类变量,承载着丰富的社会含义。对于大学生来说,生源的城乡差异是一种先赋的社会结构性力量,这一社会结构性力量很可能深深地融入他们的教育、就业和职业生涯的轨迹之中。
生源的城乡差异是二分类变量,这个变量把大学生区分为农村大学生和城镇大学生。用上大学前本人的户口性质作为衡量标准。上大学前是农业户口的学生视为农村大学生,上大学前是非农业户口的学生视为城镇大学生。随着户籍制度的城乡统筹改革以及人员的城乡流动增加,一些研究者也用家庭所在地作为区分农村大学生和城镇大学生的指标。家庭所在地对于区分生源的城乡差异是有一定分辨力,但存在和实施了半个世纪以上的户籍制度具有更丰富、更深刻的经济社会文化内涵,也具有更现实的社会分层意义。因此,本研究选择户口性质而非家庭所在地来作为区分生源的城乡差异的指标。
(2)因变量。因变量是大学初次就业的结果。在本研究中包括毕业去向、就业地区、就业产业、单位性质、岗位类型、起薪和就业满意度。前六个是客观性指标,最后一个是主观性指标。
毕业去向是分类变量,包括已经就业、有望就业但未最终确定、就业无望、读研或考研等四个取值。已经就业指已经找到工作,毕业离校即可上班。有望就业但未最终确定指在问卷调查时已经完成主要的求职程序,等待用人单位最终的确认。就业无望指在问卷调查时正在找工作但还没看到找到工作的希望,或者停止了找工作。读研或考研指已经有攻读硕士学位的机会,或者暂不就业、继续为读研做准备。
就业地区指大学生所找到的工作单位处在什么地区。就业地区有两种划分法。一种是划分为东部地区、中部地区和西部地区。另一种划分为乡镇及农村、县城(县级市)、地级市及以上城市。东部地区、中部地区、西部地区之间,尤其是东部地区与中西部地区之间,确实存在较大的经济社会发展水平差异。在农村到大都市的社区连续体之间也存在非常明显的经济社会发展差异。本研究的就业地区选择第二种划分法。因为东部地区的就业压力和生存压力大于中西部地区,其就业吸引力比过去有所下降;“孔雀东南飞”现象有所缓解;中国疆域宽广,大学生的就业有一定的地域性,在就读高校的所在地区及其附近就业的可能性更大;就业地点的城乡差异以及就业城市的层次差异,是区分大学生就业质量高低的重要指标,在就业压力比较大的当前尤其如此。
就业产业指大学生所找到的工作单位属于什么产业。就业产业分为第一产业、第二产业、第三产业。第一产业包括农业、林业、牧业、渔业。第二产业包括采矿业、制造业、电力、煤气及水的生产与供应业、建筑业。第三产业包括交通运输、仓储和邮政电信业、批发零售贸易和餐饮业、金融保险业、房地产业、社会服务业、卫生体育和社会福利业、教育文化和广播电影和电视业、科学研究与技术服务业、地质勘查业、党政机关和社会团体。大学生就业的产业差异,预示着职业声望、物质福利待遇、工作内容和工作条件等方面的差异。
单位性质指大学生在哪一类单位找到了工作。单位性质包括党政机关和事业单位、国有企业和“三资”企业、民营企业和个体经济组织、非政府与非营利组织。单位的性质不同,意味着对大学生就业的吸引力不同,工作文化和职业发展路径不同,职业声望、物质收入、工作稳定性也不同。
岗位类型指大学生就业的职位种类,主要包括管理、专业技术、技术工、普通工、行政后勤等五类岗位。虽然不同的岗位对于社会来说没有高低贵贱之分,但对于个人来说在社会声望和素质能力上还是具有层次性差异,就职者的职业发展路径也会不一样。
起薪指工作单位给已经找到工作的大学生所承诺的月薪。本研究开展调查的时间在大学生毕业离校之前,他们尚未真正入职,因此这里的起薪只是工作单位给他们的薪水承诺。本研究的起薪指工作单位承诺在他们正式入职后所应支付的月薪。
就业满意度指就业者对工作本身及其环境所持的一种态度或看法,是对其工作角色的整体情感反应。就业满意度是一个主观性指标,用李克特量表来测量。量表从就业地区、就业行业、单位性质、工作环境与条件、收入与福利、工作内容与职责、职位发展空间、自我开发与培训等八个方面去陈述问题,列出很不满意、不怎么满意、说不准、比较满意、很满意等五个答案,分别按1、2、3、4、5赋值。个案的量表得分越高,意味着就业满意度越高。
(3)中介变量。中介变量指连接自变量和因变量之间的中间变量。相对于自变量,中介变量是因变量;相对于因变量,中介变量是自变量。本研究设置的中介变量包括家庭经济条件、家庭社会资本和就读院校的层次。我国的经济社会发展存在明显的城乡差异。农村家庭的经济条件、社会资本质量一般都不如城镇家庭。高等教育的机会也存在城乡差异,城镇家庭子女的高等教育机会明显多于农村家庭子女(李春玲,2003),城镇家庭子女上好学校的可能性也要大于农村家庭子女。这种高等教育机会的不平等更多地源于政府政策、意识形态等结构性因素(肖富群,2011)。上述中介变量的城乡差异很可能影响到大学生的初次就业。
家庭经济条件根据被调查者的自我评价去决定。被调查者根据实际情况,在“好、中等、差”三个层次中选择自己的家庭经济条件所处的层次。家庭社会资本在本研究中是一个复合变量,包括父母的文化水平、父母有无工作单位以及在工作单位的职务层次、2013年接受拜年的次数、在求职过程中动用社会关系的程度。赋予每个指标以同等权重,在0—1这个区间给每个指标的具体值重新赋值,然后将各个指标的新值相加,得到家庭社会资本变量的值。
就读学校的层次包括“985”和“211”高校、一般本科院校、高职高专院校等三个层次。
(4)控制变量。根据本研究的目的,所设置的控制变量应该是不受生源的城乡差异的影响,但可能影响到大学毕业生初次就业的变量。本研究设置的控制变量有性别、是否独生子女、专业、城市类别(学校所在地)、人力资本。独生子女在学校教育(王晓涛,2011;肖富群,2011)、继续教育(王晓涛,2011;肖富群,2012)和职业技能(郑洁,2004)等方面比非独生子女有优势。所学专业不同,其职业技能、就业市场、职业方向等可能会不同。各专业培养不同的职业技能,有不同的就业市场,适应不同的职业需求。尽管有研究者将专业视为人力资本的一种,但不同的专业难以区分出层次等级,只是一个分类变量,因此本研究将专业作为控制变量。学校所在的城市层次不同,就业容量和就业机会不一样。性别、人力资本会影响到大学生的初次就业,则几乎是该研究领域中的共识。
专业按12个学科门类划分,调查中包括11个学科门类(不包括军事学),数据分析时处理为文/史/哲、经济/管理、法学/教育、理/工、农/医等五类。城市类型(学校所在地)分为直辖市、副省级城市、非副省级省会城市、地级市及以下城市等四类。调查中由被调查者直接填写城市名称,再由编码员根据编码簿归为上述四类中的对应类型。人力资本在本研究中也是一个复合变量,包括身体是否健康、是否为中共党员、是否担任过学生干部、专业成绩层次、获得奖学金次数、通过英语考试的种类数、通过计算机考试的种类数、获得职业资格证书种类数、专业实习次数、兼职次数、参加社团个数。其中通过英语考试的种类数和通过计算机考试的种类数是由多项选择题经过重新整合生成的新变量。赋予每个指标以同等权重,在0—1这个区间给每个指标的具体值重新赋值,然后将各个指标的新值相加,得到大学生的人力资本的变量值。
各类变量的基本情况如表3-1。
表3-1 各类变量的基本情况描述(n=2914)
注:“就业地区”“就业产业”“单位性质”“岗位类型”“起薪”“就业满意度”等就业结果变量的样本量为1474。
2. 数据分析思路
本研究的问题是生源的城乡差异是否会影响以及如何影响到大学生的初次就业结果。通过以下三个步骤来回答上述问题。首先,确认自变量与中介变量之间是否显著相关。用交互分类或均值比较的方法分析生源的城乡差异与家庭经济条件、家庭社会资本、学校层次等变量之间的关系。如果生源的城乡差异能明显地影响到家庭经济条件、家庭社会资本、学校层次等变量,家庭经济条件、家庭社会资本、学校层次等变量就可能是中介变量。否则,这些变量就不是中介变量,也就不必将之纳入进一步的数据分析。
其次,分析自变量与因变量之间的相关性。用逻辑斯蒂回归或多元线性回归的分析方法,以就业结果的各个指标为因变量,将自变量和控制变量纳入分析,以确认自变量与因变量之间是否显著相关。如果自变量和因变量在统计控制的条件下存在显著的相关性,就说明自变量可能影响到因变量,也就有进一步分析数据的必要。相反,如果自变量与因变量在统计控制的条件下不存在显著的相关性,就说明自变量对因变量的影响并不明显,也就不必继续进行数据分析。
再次,探讨自变量对因变量的影响及其影响的路径。在数据分析第二步的基础上,用逻辑斯蒂回归或多元线性回归的分析方法,以受自变量影响明显的因变量为因变量,将自变量、控制变量和中介变量一并纳入分析,以确认自变量对因变量的影响以及明确自变量对因变量的影响路径。如果自变量对因变量的影响依然存在,就说明自变量能直接影响到因变量;如果自变量对因变量的影响消失,就说明自变量对因变量的影响是通过中介变量间接地起作用的;如果自变量对因变量的影响依然存在但影响程度有所变化,就说明自变量对因变量既有直接影响也有间接影响,中介变量也影响到因变量。
3. 资料收集
本研究的研究对象是2013届应届大学毕业生。为了使抽样框有一个清楚的边界,此处的大学毕业生确定为在公办高等院校接受全日制高等教育的本科毕业生和专科毕业生,不包括其他类型、其他层次的大学毕业生。考虑到问卷调查的成本和可行性,对大学生初次就业结果的调查,在时间上一般会选择他们毕业离校之前,在地点上一般会选择他们所就读的学校。但由于专业实习、工作见习、求职面试等原因,很难保证应届大学毕业生在毕业离校之前一定在学校,而且不在学校的可能性比较大。这种情况下,比较适合对在校大学生进行随机抽样的分层抽样或简单随机抽样等方法就变得不适用了,只能根据研究的目的采取配额抽样。
在全国范围内立意抽取17所高等院校。院校样本尽可能考虑到院校所在地区、所在城市、院校层次等变量上的合理分布。抽取的17所高等院校中,东部6所,中部6所,西部5所;直辖市1所,副省级省会城市8所,非副省级省会城市5所,其他地级市及以下城市3所;“985”和“211”院校4所,一般本科院校7所,高职高专院校6所。
在所抽取的高等院校按配额抽样的方法选取调查对象。调查对象样本尽可能考虑到生源的城乡差异、学科专业等变量上的合理分布。所抽取的调查对象中,农村大学生占58.4%,城镇大学生占41.6%;文/史/哲、经济/管理、法学/教育学、理学/工学、农学/医学等专业分别占8.0%、29.5%、9.7%、49.7%、3.2%。
在每所被抽取的学校寻找一位专业教师负责该校的调查工作,并由该教师在该校选取5名学生(研究生、本科生、专科生)作为调查员。整个调查组由17位专业教师和85名学生组成。研究者事先设计好调查指南,连同问卷一并发送给各位负责教师,由各负责教师对调查员分别进行调查培训。
调查时间选择在2013年6月。这段时间大学毕业生往往需要准备、进行毕业论文(或设计)答辩,参加毕业典礼,办理各种毕业和离校手续,他们在学校的可能性最大。有16所学校在6月份完成了问卷调查,只有北京大学的调查延迟到7月初才完成,因为该校毕业生离校的时间稍晚。
采用自填问卷的方式收集资料。每所学校要求完成有效问卷200份左右。要求尽可能按照现场发放问卷、现场分开填答、当场回收问卷、当场检查和核实的方式开展问卷调查。总共发放问卷3300份,有效回收问卷2914份,有效回收率88.3%。
样本的基本情况见表3-2。
表3-2 样本分布