我国语言使用情况调查的回顾、问题与展望注2
提要 语言资源是国家战略资源的重要组成部分,包括语料资源和语言使用资源。本文通过对建国后我国历次语言使用情况调查进行梳理和概括,总结了三个主要问题并进行了建设性思考。上述三个主要问题是:(1)缺乏对外语使用状况的大规模、全国性调查;(2)大陆人口普查中没有语言信息统计;(3)语料资源与语言使用数据库的整合问题。
关键词 语言资源;语言调查;语言使用
语言资源是国家不可或缺的重要资源,一个国家对语言资源的了解和掌控程度是衡量国家综合实力的标准之一。国家对语言资源的全面掌控和有效管理不仅具有宏观的战略意义,也具有重要的学术研究价值。语言作为资源(language-as-resource)与语言作为问题(language-as-problem)、语言作为权利(language-as-right)并列为语言规划的三个基本定位,语言作为资源研究被认为是美国语言规划研究的重要方面(Ruiz,1984)。理想的语言规划应当建立在深入了解社会语言状况的基础之上。实况调查是理性决策的先决条件,包括全国性普查和大型社会语言学调查(戴曼纯, 2014)。国家资源发展规划包括自然资源的发展和保护规划与人力资源的发展和保护规划两部分,而语言规划就属于国家人力资源规划(Kaplan & Baldauf,1997)。从这个角度来说,国家对语言资源的掌控和规划也是对人力资源的掌控和规划,是一个国家软实力和综合国力的重要表现之一。
国家对语言资源掌控的基础是语言调查,包括宏观和微观两个方面。宏观层面上的语言调查指政府和有关机构对国家的语言文字分布状况、语言文字基本特征和使用情况的调查,包括语言普查和语言抽样调查;语言普查中既包括专门的全国语言普查,又包括在全国人口普查中对语言使用信息的调查。微观层面上的语言调查指个人、学术团体和科研机构等基于学术目的对某一领域或地域的语言调查。语言文字使用情况调查一般包括两种:一种是对语言文字具体用法的调查,调查人们对一些具体的语言成分如何使用,对这些具体用法是赞同还是反对;另一种是宏观的调查,又被称为语言状况(language situation)调查,调查人们掌握各种语言和文字的情况,使用这些语言文字的习惯和场合,对各种语言文字及其使用过程中的看法(苏金智,1999)。本文聚焦的是宏观层面上的国家语言使用情况调查。
我国是一个人口、民族和语言资源大国,语言文字构成和使用情况非常复杂,涵盖汉语方言、少数民族语言和外语等不同类别。我国也是世界上语言资源最丰富的国家之一,拥有涵盖汉藏、阿尔泰、南岛、南亚和印欧五大语系的130多种语言。近年来,随着民族融合、国内不同区域间交往和国家对外交流的日益扩大,我国语言文字及其使用状况也快速变化,如部分方言和少数民族语言濒临衰亡,外语的使用逐渐增多,网络语言使用范围进一步扩大等,已成为政府、学界和社会关注的热点和焦点。然而国家对语言状况还缺乏了解,开展国家语言调查工作将有利于科学制定国家语言政策,协调各种语言、方言间的关系,促进国家统一、维护国家安全,合理培养外语人才,掌握虚拟空间的话语权(李宇明, 2007)。本文通过对新中国成立以来我国历次语言使用情况调查进行梳理和概括,总结其主要问题,并提出建设性意见和拟解决路径。
1.大陆的语言使用情况调查概述
1.1 已完成的语言使用情况调查
迄今为止,我国完成的大规模语言使用情况普查主要有:20世纪50年代少数民族语言调查和90年代末的中国语言文字使用情况调查。大规模抽样调查主要有:20世纪80年代后期少数民族语言调查和“中国人的语言意识与外语观”调查,具体情况如表1所示。上述调查还是以少数民族语言调查为主,说明少数民族语言调查是当时我国急需的。调查机构也由最初的科研院所过渡到语言文字的政府管理部门国家语言文字工作委员会,表明语言调查越来越受重视,政府行政手段已经介入。语言调查的范围也由少数民语言、汉语方言逐渐过渡到涵盖外语使用情况的调查。
表1 大陆已完成的主要语言使用情况调查概况
1.2 正进行的语言使用情况调查
21世纪正在进行的大规模语言使用情况调查主要有4个,如表2所示。除了继续关注少数民族语言外,调查更注重以往忽视的方面,如跨境语言的分布、使用情况和高校外语学习情况。调查的受资助来源也越来越广泛,有校内985项目,国家语委重大科研项目和国家社科基金重大招标项目等。调查的多元资助,说明国家对语言调查的支持力度越来越大,支持途径越来越多。
表2 大陆正进行的主要语言使用情况调查概况
2.港澳台地区语言使用情况调查概述
我国港澳台地区基于学术研究的语言调查很多,但就大规模的语言使用情况调查而言,主要体现在人口普查中的语言信息调查,如表3所示。香港和澳门已多次在人口普查中开展语言使用信息调查,台湾于2010年底首次将语言信息纳入人口普查中。港澳台语言普查主要是为了了解和掌握区域内惯用语(Usual Language)的使用情况。如澳门调查的重点是广州话、普通话、葡语和英语的使用情况;台湾调查的重点是国语、闽南话和客家话的使用情况(戴红亮,2013);香港调查的重点是广州话、普通话、英语和其他中国方言的使用情况。
表3 港澳台地区人口普查中语言使用情况调查概况
在香港2011年人口普查中,依据香港特区政府《2011年人口普查简要报告》中的统计信息(香港特区政府统计处,2012:7,39—40),广州话是家中最常用的语言,约有96%的5岁及以上人口能说广州话,和2001年的水平相当。能说英语的人口比例由2001年的43%增至2011年的46%,涨幅为3%。相比而言,变化最大的是普通话,能说普通话的人口比例由2001年的34%增至2011年的48%,涨幅高达14%。除此以外,其他语言或方言的人口使用比例依次排序为:客家话、潮州话、福建话、印尼话、菲律宾语、日本语和上海话等。香港语言普查数据表明香港与内地的交往越来越密切,普通话的逐渐普及和推广是大势所趋。外语使用状况除了表明英语是传统使用语言外,印度尼西亚、菲律宾和日本等国与香港的交往相对密切,有一定的影响力。在两次人口普查之间,特区政府在2006年中期人口统计中,也对语言使用情况进行了调查。2011年人口普查简要报告中还对2001年、2006年和2011年的语言调查数据进行了对比分析,用以掌握语言使用的动态变化情况。语言普查数据是特区政府掌握全港语言资源、了解语言使用状况、拟定语言使用标准和规范、制定合理语言(教育)政策的重要依据。
澳门2011年人口普查对语言能力进行了调查。依据澳门特区政府2011年人口普查详细结果报告中的统计信息(澳门特别行政区政府统计暨普查局,2012:12—13),使用广州话为日常用语的有449 274人,占年龄在3岁及以上人口的83.3%,比2001年普查结果下降4.6%。由于移入人口及外地雇员增加,使用普通话(5%)及英语(2.3%)为日常用语的比2001年分别上升3.4%和1.6%。除了日常用语外,普查对“整体语言能力”也进行了统计。“整体语言能力”指能说某种语言,但不一定把该语言作为日常用语。整体语言方面,有41.4%能讲普通话,较2001年增加14.7%;另外有21.1%能讲英语,有2.4%能讲葡萄牙语。澳门对语言能力的普查结果表明:普通话的影响力越来越大,澳门虽曾受葡萄牙的殖民统治,但与香港相比,葡语的使用、普及和影响力远小于英语。澳门语言普查结果是政府制定语言政策、特别是语言教育政策的重要依据。
3.问题与展望
3.1 缺乏对外语使用状况的大规模和全面调查
在我国已完成的语言调查中,还没有全国范围内的、专门的、大规模外语使用情况调查,国家对各类外语人才状况和分布信息不了解。大陆已完成的中国语言文字使用情况调查包含了外语使用情况的调查,但调查面有限,只包括对初中以上人群学过外语的情况、学过外语的人群学习不同语种的情况、学过英语的人群不同会话能力的情况、学过英语的人群不同阅读能力的情况和学过英语的人群英语使用情况等的统计。我国外语使用和学习的主体主要在高校,但目前没有这方面的统计。已完成的“中国人的语言意识与外语观”调查虽然涉及了外语,但侧重点只在日语的使用情况。此外,针对国内一些外国人聚集区的中国人语言使用情况调查还没有开展,如北京望京地区韩国人聚集区、北京雅宝路地区俄罗斯人聚集区、广州小北路地区黑人聚集区等,针对这些区域的语言调查有助于语言应急服务和语言援助服务。
目前,我国政府已经委托科研机构着手开展此项工作,如2012年立项的国家社科基金重大招标项目“国家外语人才资源动态数据库建设”。该项目以建设国家外语人才资源动态数据库为目标,优化国家对外语人才资源的使用成效和对外语人才资源的规划。项目的核心内容之一是全面了解我国高校外语类专业(英语、日语、法语、商务英语、翻译等)教师和学生、外语技能较高的非外语专业人才的外语掌握和学习情况。项目第一批数据库将重点建设高校师生库,包括外语专业教师数据库、外语专业学生数据库和高端外语人才数据库。随之,国家语委2013年度重大科研项目“国家语言志愿者人才库建设”也将对外语人才及外语使用情况进行局部范围内的统计、摸底和试点工作。
3.2 大陆人口普查中没有语言信息统计
截至现在,我国大陆地区还没有在人口普查中加入语言信息的统计。而国外许多国家,如美国、俄罗斯、英国、加拿大、澳大利亚、巴西、印度等都充分利用人口普查机会,调查全国语言资源,此举既节省了成本,又获得了全面详实的数据(文秋芳等, 2014);我国港澳台地区人口普查中也都包含语言使用情况调查。相对耗时、费力、缺乏标准化的专门语言普查而言,在人口普查中增加语言信息调查是权宜之计。有些学者已经呼吁建议从第七次全国人口普查开始,参考国外和港澳台经验,增加对公民语言使用状况的调查。调查以问卷形式呈现,涵盖对惯用语言和其他语言使用情况的调查(文秋芳, 2014)。这些呼吁已经得到教育部和国家语委主要领导的回应和批示,相关调研以及在人口普查中增加语言普查的综合实施方案也已被国家语委列入近期工作计划。人口普查中的语言调查需要注意以下三点。第一,需要成立语言资源调查协调管理部门(文秋芳, 2014)。国外的语言普查都是由国家统计机构负责,而我国已进行调查的负责机构多是国家语委、中国社科院民族学与人类学研究所和语言研究所以及其他高校科研机构,因此成立以国家统计局和国家语委为主导的语言资源调查协调管理部门是必由之路。第二,人口普查中的语言调查问卷可借鉴国外和港澳台经验,既简明扼要,又突出重点。第三,语言普查的基础是开展试点工作和出台可行性研究报告,因此通过国家语委的经验性指导及其下属语委单位的协作,在现有国家统计局经常性抽样调查中增加语言内容的试点工作,亟待实施。相关部门可参考已有的国内调查经验和国外普查经验,结合我国语言国情、技术条件和工作目标,对普查内容、普查方式、统计和分析标准、人员培训、信息汇总、数据管理和过程监督等一系列问题进行科学论证,咨询专家意见,形成初步方案;进而选取有代表性的国家统计局经常性抽样调查地区作为普查试点,在试点中积累经验,完善最终方案。
3.3 语料资源与语言使用数据库的整合问题
语言资源可以分为语料资源和语言使用状况数据两种。语料资源指各种语言的声音和文本材料,后者指不同语言和语体使用者的数据。本文所关注的是后者,而不是前者。国家通过对本国语言使用状况数据的掌控,可以有效地调用这些资源,为维护和拓展国家利益服务。对语言资源调查的目的之一就是国家对语言资源进行较全面的掌控,而掌控语言资源最好的办法是建立语言人才资源动态数据库。语言人才资源是国家的重要战略资源和人力资源,建设国家语言人才资源库是一项重大基础工程。
语言资源数据库不仅能为制定国家语言战略规划提供科学依据,实现语言概况查询、语言应急和语言援助等显性功能;还可以实现政治功能和教育功能等隐性功能,如美国语言地图(MLA Language Map)可以提供4700万讲非英语人士的背景信息(文秋芳等,2011)和全美300多种语言的使用者的具体人数及所占比例,通过美国语言地图可以了解美国移民情况、美国语言教育情况和美国对语言资源的掌控情况等。现阶段,我国还没有语言人才资源动态数据库,特别是没有建立高端的少数民族语言人才、跨境语言人才和外语人才资源动态数据库。目前,国家社科基金重大项目“国家外语人才资源动态数据库建设”和国家语委重大科研项目“国家语言志愿者人才库建设(第一期,以外语为主)”已经启动,并按研究计划稳步推进,但这只是国家语言资源人才库的一部分,具有探索性和尝试性。我国少数民族语言人才、跨境语言人才和方言人才数据库的建设也亟待建设和启动。依据语言调查结果,建立语言资源数据库和语言资源人才库,对我国既有现实意义,也有战略意义。
“其势已成、其时已至”,建立和整合国家语言资源数据库迫在眉睫。依据语言普查和抽样调查数据,国家语言资源数据库可分为3个子库同时推进,逐步完善。基于人口普查的语言资源数据,建立全国语言资源数据子库,提供我国语言资源种类和人口的语言掌握情况;基于年度抽样数据,建立全国语言资源动态数据库,揭示语言资源年度变化情况;基于高校语言课程学习数据,建立全国高校语言人才库。三者共同构成国家语言资源数据库(文秋芳, 2014)。
值得注意的是,语料资源数据库与语言使用者数据库的建设也是相辅相成的,语料资源的收集过程中必然涉及语言使用者问题,两者可以适当有机整合。日前,笔者分别以“数据库”和“语料库”为关键词在国家社科基金项目数据库中检索,共查询到语言学及其相关类别(跨学科)的国家社科基金重大项目12项(见表4),涵盖汉语、外语和少数民族语言等不同类别。国家社科基金重大项目是目前国家社科基金项目资助体系中层次最高、资助力度最大、权威性最强、社会认可度最高的国家级哲学社会科学项目类别。笔者认为有些数据库和语料库的建设可以在收集语料的同时,兼顾语言使用情况的调查,如少数民族语言、方言、盲文和手语的调查与建库。这些现有数据库要打破原有体系壁垒,语料资源收集的同时要兼顾语言使用者数据的收集,整合资源,实现资源共享,共同为国家语言资源数据库的建立添砖加瓦。
表4 国家社科基金重大项目语言学类立项概况
除了国家社科基金重大项目外,国家语言文字工作委员会于2008年启动了“中国语言资源有声数据库”建设,这是国家语委依托学界开展的一项重大语言保护工程,目的是保护文字,弘扬文化,建立语言资源有声博物馆。该项工程遵循“政府主导、学者支持、社会参与”的工作模式和行之有效的专家团队运作和管理办法,取得了良好的效果(教育部语言文字信息管理司,2014)。此项工程也得到国家相关部门的支持,如科技部专门立项支持有声数据库研究和平台建设。该数据库侧重采集我国各少数民族语言及其方言的有声资料,目前江苏率先完成了全省数据的采录、整理及验收,并启动了江苏地方口头文化采录工作;北京是继江苏之后第二个全面完成建设工作的省级语言资源有声数据库的城市;上海、辽宁、广西也全面铺开了本省语言资源有声数据库建设工作。今年又有山东、福建、河北等省启动建库工作(张浩明, 2014)。笔者认为,该库应该在收集有声语料、绘制区域汉语方言地图的同时,收集语言使用者的相关信息。当然,语言使用数据收集的工作难度和强度要大于语料数据收集,因此这些项目还需要国家有关部门的不断支持、协调和持续投入。
国家对语言资源的调查和语言资源数据库的建立是衡量一个国家对语言资源是否能够有效地进行战略管理的重要标志,美国在此方面积累了相当丰富的经验(文秋芳等,2014)。本文通过对我国主要的几次语言使用情况调查的回顾,分析了其主要问题:缺乏对外语使用状况的大规模和全面调查;大陆人口普查中没有语言信息统计;语料资源与语言使用数据库的整合问题。针对这些问题,笔者对此进行了一些建设性思考和展望。希望本文能起到抛砖引玉的作用,尽快在我国第七次人口普查中增加语言使用情况的调查,使国家尽早摸清我国的语言国情,为国家语言文字事业的发展做好基础性和铺垫性工作。2012年和2013年全国人大代表、政协委员提出的有关语言资源调查的建议和提案共3个,分别是政协十二届五次会议关于“我国亟待进行全国语言普查”和“中国语言文字博物馆”的提案,政协十一届五次会议关于“国家尽快立项建设中国语言资源有声数据库”的提案(教育部语言文字信息管理司,2013)。这些提案和建议突显了我国语言调查和资源库建设的必要性。语言国情调查是一项复杂的社会工程,需要国家高层重视、顶层设计、政府协调、社会认同和全民参与,涉及诸多宏观政策方面和一些微观的技术性细节问题。目前,我国的语言资源已引起国外的注意,如2013年,两个美国人创办的汉语方言资源库“乡音苑”正式上线,并在我国日益引起关注,产生较大影响,该数据库已收集、录音和转写500多段方言故事,注册会员达万人,网站访问量很大。其资源建设成效、背景和国家安全等方面,都值得我国政府关注和深入思考。有鉴于此,我国语言使用调查及其相关资源库建设工作亟待开展、刻不容缓。
语言资源和语言生活是国家语言政策与规划的对象。李宇明(2011)认为语言资源包括三类:自然语言资源(包括汉语及方言、少数民族语言文字、外国语言文字)、衍生语言资源、公民的语言能力和国家语言能力。国家对语言资源能否掌控标志着国家是否能将潜在的语言能力转变为现实的语言能力(文秋芳等,2011),而国家对外语资源掌控的基础是语言调查。本文通过对我国对语言资源调查和管理现状的梳理,发现了我国与国外发达国家的差距。特别是美国的语言调查的分类和手段,对我国多有启示意义。
前不久,北京外国语大学文秋芳教授主持的国家社科基金重大项目的阶段性成果“加强语言资源调查,提升国家语言能力”一文刊发在国家社科基金《成果要报》上,并先后受到了教育部部长袁贵仁和国家语委主任、教育部副部长李卫红的批示。2014年4月,教育部语言文字信息管理司专门邀请文秋芳教授及其带领的研究团队就如何落实教育部领导批示等议题进行了研讨。语信司司长张浩明就开展语言普查的综合性实施方案提出了指导意见。文秋芳教授就实施语言普查面临的困难和如何进行可行性研究与语信司领导交流了看法。笔者作为研究团队的成员之一,也希望借此契机,在语信司的支持和推动下,我国政府其他相关部门和研究团队能尽快开展我国语言普查的先导性和可行性研究,以便在国家第七次人口普查中,加入语言使用情况调查的内容。
附注
1. 表1和表2的部分内容源自黄行(2013)、傅懋勣(1984)。
2. 中国社会科学院民族研究所(1994)。
3. 中国语言文字使用情况调查领导小组办公室编(2006)。
4. 刘夏阳(1999)。
5. 李宇明(2008)。
6. 中国新闻网(2011)。
7. 颜贝珊、余清祥(2010)。
参考文献
澳门特别行政区政府统计暨普查局 2012 2011年人口普查详细结果,12—13页。http://www.dsec.gov.mo/Statistic/Demographic/PopulationCensus/2011PopulationCensus.aspx?lang=zh-CN。
戴红亮 2013 港澳台人口普查中的语言数据分析,《语言文字应用》第2期,19—25页。
戴曼纯 2014 语言政策与语言规划的学科性质,《语言政策与规划研究》第1期,5—15页。
傅懋勣 1984 建国三十五年来民族语言科研工作的发展,《民族语文》第5期,1—8页。
黄 行 2013 少数民族语言文字使用情况调查述要,《民族语文》第3期,64—78页。
教育部语言文字信息管理司编 2013 全国人大代表提议/全国政协委员提案,载《中国语言生活要况》,北京:商务印书馆。
教育部语言文字信息管理司 中国语言资源有声数据库北京库建设完成调查验收,http://www.moe.edu.cn/publicfiles/business/htmlfiles/moe/moe_814/201408/172754.html。2014年8月10日读取。
李宇明 2007 “中国语言普查”工作务虚会讲话,北京语言大学。
李宇明 2008 语言资源观及中国语言普查,《郑州大学学报(哲社版)》,第1期,1—7页。
刘夏阳 1999 中国普及普通话现状分析,《中国人民大学学报》第6期,104—107页。
苏金智 1999 国内外语言文字使用情况调查概述,《语言文字应用》第4期,66—72页。
文秋芳 2014 以语言资源调查推动国家语言能力提高,《中国社会科学报》(国家社科基金专刊第59期),2014年3月26日。
文秋芳、张天伟 2014 国外语言资源管理的经验与启示,《新疆师范大学学报(哲社版)》第6期,99—104页。
文秋芳、苏 静、监艳红 2011 国家外语能力的理论构建与应用尝试,《中国外语》第3期,4—10页。
香港特别行政区政府统计处 2012 2011年人口普查简要报告,7:39—40。http://www.censtatd.gov.hk/hkstat/sub/sp170_tc.jsp?productCode=B1120055。
颜贝珊、余清祥 2010 2010年各国人口普查制度之研究,《人口学刊》第40期,203—229页。
张浩明 2014 “拓展视野、知行天下,为发展国家语言文字事业而努力”,语言文字应用中青年学者研修班讲座,北京,2014年7月。
中国社会科学院民族研究所 1994 《中国少数民族语言使用情况》,北京:中国藏学出版社。
中国语言文字使用情况调查领导小组办公室编 2006 《中国语言文字使用情况调查资料》,北京:语文出版社。
中国新闻网,澳门十年一次的人口普查12日启动,为期15天[OL],http://www.chinanews.com/ga/2011/08—12/3253383.shtml,2011—08—12。
Ruiz,R. 1984.Orientations in Language Planning.NABE Journal 8(2):15—34.
Kaplan,R.B.& Baldauf,R.B. 1997. Language Planning : From Practice to Theory. Clevedon:Multilingual Matters.