二 贵州民族语言文字信息化建设现状
为了满足语言文字相关领域的信息化需求,贵州近几年一直积极开展少数民族语言文字信息化工作。民族语言文字信息化工作包括民族语言文字信息化平台搭建、民族语言文字资源库建设、民族语言文字网站建设、民族语言文字软件的开发及应用等。信息化平台搭建和资源库建设是信息化工作的基础,网站建设和软件开发应用须基于这两项工作。贵州省信息化工作起步较晚,因此现阶段的工作是以信息化平台搭建和资源库建设为主,以网站建设和软件开发为辅。
(一)少数民族文字信息化平台搭建
信息化平台搭建主要针对传统民族文字,如编码字符集建设、字形标准和键盘标准等。贵州省的苗族、布依族、侗族均使用新创文字,所以使用一般拉丁字母就能满足信息处理需求;而传统文字彝文、水书等需要进行国际标准码申报、字形标准制定、输入法设计等一系列工作。彝文的信息化平台搭建在云南、四川、贵州、广西四省份的共同努力下已基本完成;而水书的信息化平台搭建工作则处于起步阶段,2015年7月23日开始在荔波县召开“中国水书编码提案”申报研讨会[2],成立专门机构进行水书申报国际编码的相关工作。
(二)民族语言文字资源库建设
民族语言文字资源库建设是现阶段贵州民族语言文字信息化工作中的重点。贵州省最早开始的民族语言文字资源库建设是2008年的仡佬语数据库工程,其目的是抢救濒危的仡佬语。随后,为了贯彻落实《国家中长期语言文字事业改革和发展规划纲要(2012—2020年)》提出的“积极建设中国语言资源有声数据库和少数民族语言文字数据库”要求,贵州省启动了各民族语言文字数据库建设,拟建设一个完整的贵州母语数据库,在此基础上,贵州民族大学龙海燕主持的2014年度国家社科基金重大项目“贵州省少数民族语言资源有声数据库建设”立项,目前此项工作正积极展开。2015年,全国范围的语言资源保护工程全面启动,主要内容就是“对原有中国语言资源有声数据库建设进一步补充、整合,目标是利用现代技术手段,收集记录汉语方言、少数民族语言和口头语言文化的实态语料,通过科学整理和加工,建成大规模、可持续增长的多媒体语言资源库”(田立新,2015)。该工程2015年度计划开展160个调查点的调查工作,其中包括80个少数民族语言调查点,贵州省作为一个多民族聚居的省份,也是调查的重点地区,目前各位民族语言专家学者正在按严格的规范标准采集原始数据。因为水书编码、字形、输入法等问题尚未得到解决,水书仅于2015年7月19日初步完成了水书档案资源数据库建设,以图片的形式扫描存档,并未真正实现水书信息化。
(三)民族语言文字网站
贵州民族语言文字网站建设工作相对滞后,专门的民族语言文字网站一直未出现,只有一些包含民族语言文字的网页;而包含民族文字网页的一类网站均由一些民间学会和群众个人发布,无官方组织发布;包含民族语言音频视频的网站虽然有一部分是政府官方媒体发布的,但其主体也是以汉语为主,如包含苗语、布依语新闻视频的金州广电传媒网。
(四)民族语言文字软件
语言文字软件的范围十分广泛,包括输入法软件、文字识别软件、文字排版软件、语音识别软件、语音合成软件、分词软件、句法分析软件等。而贵州的少数民族语言文字软件只有与彝文相关的,且多是多省联合开发、共同应用的。而贵州的苗族、布依族、侗族文字是拉丁字母文字,虽然可以用英文输入法代替,输入不存在障碍,但没有专用的输入软件,十分不利于后续语言文字识别软件的进一步开发利用及更深层次的少数民族语言文字信息处理工作的开展。