信息处理用粤方言字词规范研究
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

绪篇

第1章 粤方言字词规范研究概况

1.1 粤方言字词规范研究综论

粤方言,又称粤语,是通行于广东、广西、香港、澳门以及海外华人社区的一种汉语方言。粤方言跟其他汉语方言相比,除了在发音、词汇以及语法等方面都有所区别外,还有一个明显的不同,即它还具有一套完善的记录方言的文字系统,简称为粤方言字。粤方言字作为汉字的从属系统,其功能主要是记录日常使用的粤方言。粤方言字主要由两部分构成:一是与通用汉字重合的部分;二是粤方言特有的方言字部分。广义的粤方言字指的是粤方言区的人民用来记录粤方言的所有汉字,包括通用汉字、假借字(借读音和字形而不借字义)、训读字(借字形和字义而不借读音)、沿用古汉字(现代通用汉字一般已不再使用)和自造字。狭义的粤方言字指的是粤方言区人们创造出来的专门用来记录粤方言特有语素的字,这些字一般只在粤方言区内使用,不见于其他方言区,更有别于通用汉字,主要是自造字,还有部分沿用古汉字、假借字和训读字。

由于粤方言的常用词以单音节词为主,因此许多粤方言字所记录的既是语素,也是词。而粤方言词规范所涉及到的词音(如多音词)和词形(如异形词)问题,也主要跟用字问题相关,因此我们把粤方言的字词规范合并起来一起讨论。

粤方言字词的用途比较广泛。除了编纂辞书需要记录和使用粤方言字词外,穗港澳地区的粤语教科书、口头文学、街头广告、报刊杂志、港澳的电视传媒等都大量用到粤方言字和粤方言词。粤方言字在实际生活中的使用情况一直是学者们比较关心的一个话题,这方面的成果也不少。如曾子凡的《广州话口语词在用字上的一些特点》(1990),陆镜光的《香港粤语通俗小说的书写系统》(1991/1992)和《在大义与小说之间:香港粤语口袋书的书写系统》(1995),韦树关的《粤语方言字刍议》(1997),程祥徽的《“繁简由之”与港澳用字》(1997)及《港澳用语用字问题》(2001),钟奇、高然的《广东坊间特殊用字调查报告》(2000),詹伯慧的《关于方言词的用字问题——以粤方言为例》(2003),周柏胜的《香港粤语用字的使用与准则》(2003),赵一凡的《浅谈港台书面语中的方言字》(2008),黄耀堃的《粤方言的“並存並用”与香港增补字符集》(2011)等。因为粤语的使用涉及内地、港澳以及海外华人社区,加上历史的原因导致内地和港澳在繁简字形使用上的不同,这都给粤方言字的使用带来了许多问题。这方面的研究对我们了解粤方言区的文字使用情况以及促进社区的语言和谐具有重要意义。

粤方言字词跟其他方言一样,一直以来都缺乏相应的规范。对于粤方言字词是否需要规范这个问题,从民间到学界都有不同的意见。有人认为粤方言不属于官方用语,没有规范的必要;有人认识到粤方言字词规范的重要性,但有非学术层面的担心,故一直没有行动。多数学者是积极主张要对粤方言用字词进行规范的。田小琳(1992)曾从中文和英文、普通话和粤语、《汉语拼音方案》和《注音符号》、简化字和繁体字、规范词语和社区词语五个不同层面谈香港社会的语言文字规范化的取向。周无忌(2003)曾呼吁“粤方言用字应予以规范”并提出四点意见;韦树关(1997)针对粤语的用字问题提出五点规范意见;郭敏珊(2008)也讨论过粤方言字的规范问题;邓景滨(2001,2004,2005)多次提出要对粤方言字进行优化处理,特别要对粤方言异体字进行整理和规范;汤志祥(2003)在《香港粤语词语的规范化问题》中探讨了香港粤语词语目前需要规范的各个方面,并提出了规范的办法;侯兴泉等(2014)从信息处理的角度强调了粤方言字规范的重要性,并探讨了粤方言字规范的主要内容。我们认为粤方言区的书面用语要区分对外和对内两种场合,对外的书面表达应尽量使用通用汉字和通用词语,避免使用方言字和方言词语。对内的书面表达可以使用方言字词,但也需要注意规范,否则内部交流就会有较多的障碍,这也正是不少学者呼吁要对粤方言字词进行规范的原因。

在对粤方言字词进行规范之前,首先要对粤方言字词尤其是方言字进行收集和整理。这里要特别介绍一下张群显和包睿舜合写的《以汉字写粤语》(The Representation of Cantonese with Chinese Characters)(2002)一书。该书用英文写成,全文发表在《中国语言学报》(Journal of Chinese Linguistics)第18期上。这本专著由四个章节和一个附录组成,主要内容有两大部分:第一部分主要介绍在香港这个独特环境中产生的粤方言字,描写其造字基础,并介绍粤方言字与通用汉字以及计算机之间的关系;第二部分虽然只是以附录的形式呈现,但其实是该书的核心内容,系统收录了1095个不同的粤方言字,并根据这些粤方言字在中文电脑字符集中的分布,分成三个附表,逐一列出这些字在大五码和香港增补字符集中的电脑编码、粤拼注音、英语翻译、用法及例子、字形出处等。该书奠定了粤方言字信息处理的基础,给粤方言字的研究和应用做出了很大的贡献。

跟粤方言字词规范相关的还有粤方言字符集方面的研制工作。跟粤方言用字相关的两个重要字符集,一个是国家技术监督局发布的《图文电视广播用汉字编码字符集·香港子集》(GB/T15564—1995),另一个是香港特区政府公布的新版《香港增补字符集-2008》(HKSCS-2008),后者在港澳应用更为广泛。《香港增补字符集-2008》沿用《香港增补字符集-2004》的两个编码方案,分别配合大五码及ISO 10646国际编码标准,《香港增补字符集-2008》收录了四百多个粤方言字,这对粤方言字在电脑中的使用起到了十分重要的作用。Unicode CJK扩展A、B、C区字符集里也收录了许多粤方言用字。字符集的制定是语言信息处理的前提,因此这方面的研究意义重大。可惜的是目前电脑收集的粤方言字多以繁体为主,简体偏少,一些很常用的粤方言字如“嗰”“嚿”“孭”“瞓”等都没有相应的简体字,这说明粤方言字字符集的研制工作仍需继续进行。

涉及粤方言字词处理方面的论文不多,目前见到的有黎邦洋的《关于讯息用香港字》(2003)和唐晓阳、林英的《我国古粤方言词典数字化系统设计研究》(2003)。其实粤语字词处理方面仍有不少问题值得探讨,诸如码位的选择、字体的制作、底层码和表层码的对应、规范词表的制定、词类和词性标注的规范等都值得进一步研究。

有些论文虽然不直接讨论记音规范,但跟粤方言字音的规范相关。如饶秉才的《粤方言字音的订音问题》(1980)、张群显的《粤语常用字字音异读研究》(1991)、施仲谋的《常用字广州话读音调查》(2005)等。这几篇论文都比较重视研究常用粤方言字的实际读音,尤其是异读音的研究,这些研究对粤方言字的正音工作是很有帮助的。

总的来说粤方言字词的规范得到了众多学者的认可,但是真正开展工作的机构或人员很少。粤方言字词规范涉及到的很多基础问题都没有解决,譬如粤方言字词的定量研究、异体字和异形词的收集与整理、多音字词的收集与整理、繁简字的收集与整理、无码粤方言字的收集与整理、词类和词性标注规范的制定等等。

规范粤方言字词不是为了限制粤方言区人民使用语言文字的自由,而是根据目前的实际情况指导人民方便准确地使用粤方言字和粤方言词,更重要的是为计算机处理粤方言信息服务,提高粤方言信息处理的效率和质量。粤方言字词的规范主要包括粤方言字词的定性、读音规范、字形规范、繁简对应、无码字的规范、词类和词性标注规范等内容。

在大数据应用领域不断扩大和深化的信息时代,为了更好地发挥粤方言字词的应用价值,以及促进粤方言信息处理及相关事业的发展,在规范研究的基础上制订一系列的字词规范量表并加以推广是非常有必要的。

1.2 粤方言字词工具书的编纂

在没有官方牵头组织制定相应的规范标准的情况下,民间和学界自发编纂的粤方言字典和词典就显得比较重要了,特别是一些优秀的粤方言字词典,由于其流传时间长,使用范围广,无形中起到了引导规范的作用。因此有必要对历史上出现过的粤方言字词典工具书进行一番详细的介绍。

1.2.1 粤方言字典的编纂

粤方言字典的编撰很早就开始了,最早的一本粤方言字词工具书《广东省土话字汇》(Vocabulary of the Canton Dialect)是由英国传教士罗伯特·马礼逊(Robert Morri-son)在1828年编写出版的。若是把韵书也看作是字典的一种特殊类型,那粤方言字典的出现时间就更早了,清初的时候就有人编了一本粤方言韵书《分韵撮要》。在接下来接近两三百年的时间里,尤其是进入二十世纪以后,有关粤方言的字典如雨后春笋般涌现,成果丰硕。总的来说,粤方言字典有三大类型:1)粤方言字汇或韵书;2)粤方言字典;3)粤外或粤普对照字典。

(1)粤方言字汇或韵书的编纂

字汇(即字音汇集)或韵书,突出的是字音收集与整理。最早的粤方言韵书《分韵撮要合集》(成书时间和作者不详,目前看到的最早的版本是1782年的《江湖尺牍分韵撮要合集》),记录了清初珠江三角洲一带的粤语语音。之后一百多年间很少有粤方言方面的韵书面世。进入二十世纪以后,有关粤方言字汇或韵书类著作就逐渐多起来,其中不得不提的是瑞典汉学家高本汉的《汉字与汉日分析字典》(Analytical Dictionary of Chinese and Sino-Japanese)(1923),里面列举了粤语和国语、普通话、古汉语的字音对照资料。其他字汇或韵书有冯汉的《粤音依声检字》(1935),陈瑞祺等的《道汉字音》(1939)和《粤音图说》(1939),黄锡凌的《粤音韵汇》(1941),冯思禹的《广州音字汇》(1962),林莲仙的《粤读反切音标两用正音表》(1975),冯田猎的《粤语同音字典》(1974),欧绍华的《广州话同音字汇》(1980),陈岫山的《粤语查音识字字典》(1985),周无忌、饶秉才的《广州话标准音字汇》(1988),香港语言学会编的《粤语拼音字表》(1997),何文汇、朱国藩的《粤音正读字汇》(1999)等。这些字汇或韵书对传播粤方言尤其是权威方言广州话的读音起到非常重要的作用。

(2)粤方言字典的编纂

专门的粤方言字典,主要包括字的形、音、义及其用例等方面的基本信息。这类字典工具书近一两百年内一直都有人在编著。譬如最早的《广东省土话字汇》(1828)、鲍尔和詹姆斯·戴尔的《简易粤语字典》(1908)、何类思的《常用粤语字词》(1909)、高利士的《广州话袖珍字典》(1914)、陈瑞祺等(1939)的《道字典》、美国国防部语言学院的《粤语常见字字典》(1959)、蔡家文的《粤音字词选辑》(1963)、欧德理的《汉语粤方言字典》(1976)、饶秉才主编的《广州音字典》(1983)、詹伯慧主编的《广州话正音字典》(2002)等。尤其是最后两本粤语字典,在穗港澳及海外都很流行,是同类型粤语字典中影响最大的两本。

(3)粤外或粤普对照字典的编纂

粤普或粤外对照字典的编纂历史很长,成果也很丰富。最早的三本粤外对照字典都是粤英对照字典,全都是由美欧在中国的传教士所编,如美籍传教士卫三畏编的《英华分韵撮要》(1856)、德籍传教士欧德理的《粤音汉英字典》(1877)、英籍传教士湛约翰的《英粤字典》(1878)。进入20世纪后还有威礼士牧师编写的《英粤字典》(1931)。这跟穗、港、澳地区是西方传教士在中国最早开展传教的地方之一有莫大的关系。到了20世纪初,还出现了粤法对照字典,如何类思的《法粤字典》(1902)和《粤法字典》(1912)。

粤普对照字典在20世纪中期前后开始出现,因为这个时期无论是中华民国还是新中国政府都比较注重推广国音。粤普对照字典如黄元生的《国粤音对照速解字汇》(1946)、广智书局的《国音粤音新字典》(1960)、乔砚农《广州音国音中文字典》(1963)、冯思禹的《广州音国语音新编中文字典》(1969)等。这类字典无论是对北方人学粤语还是对粤语区人们学习普通话,都起到积极的促进作用。

20世纪70年代之后,粤普字典开始大量出现,如余秉昭的《同音字汇(国粤语注音)》(1971)、冯浪波的《国语粤语两用中文字典》(1977)、中华书局香港分局编的《普通话粤音中华新字典》(1978),张励妍、张赛洋的《国音粤音索音字汇》(1987),黎明的《国音粤音中文字典》(1987),李瘦芝、陈有良的《广州同音普通话异音字汇手册》(1988),欧绍华、曾铁飞《国语粤语繁简字对照字汇》(1990),关彩华的《英粤字典》(1991),苏翰翀的《实用广州音字典(同音字并列·普通话对照)》(1994)等。前面介绍到影响很大的《广州音字典》和《广州话正音字典》也兼具粤普对照的功能,也可以看作是粤普对照型字典。

通过上面的介绍不难看出,粤语韵书或字典总量之多,除普通话字典之外其他方言的字典无一能出其右。众多粤语字典的编写和出版也说明了两个问题:1)一直以来海内外对粤方言字典这类工具书都有较大的需求量,反映出粤方言在海内外拥有较强的影响力。2)从事粤方言字典编写的人员较多,有传教士、中外粤语教师、语言学研究者、民间热心人士、出版社的编辑等,不同专业不同价值取向的人员编出了各式各样的粤方言字典,一方面满足了不同人群的需求,另一方面也造成了一些低水平的重复建设。

(4)小结

在众多的粤方言字典或韵书中,也出现了一些影响较大的作品,如黄锡凌编写的《粤音韵汇》、香港语言学会编的《粤语拼音字表》、饶秉才主编的《广州音字典》、詹伯慧主编的《广州话正音字典》、中华书局香港分局编的《普通话粤音中华新字典》等。这些工具书对粤方言字的研究和应用、粤语的教学和推广都作出了巨大的贡献。尤其值得一提的是詹伯慧先生主编的《广州话正音字典》,联合了穗港澳几十位语言学界的优秀学者历时十几年编写而成,是粤语字典编写的集大成之作,十多位大陆及港澳学者都曾对这部字典给予过正面的评价。

1.2.2 粤方言词典的编纂

(1)通用型粤方言词典

这类通用型粤方言词典是比较多的,使用面和影响往往也是最大的。其中由粤方言研究专家参与编纂的粤方言词典往往影响比较大,譬如乔砚农编著的《广州话口语词的研究》(1966),饶秉才、欧阳觉亚、周无忌编写的《广州话方言词典》(1981),陈慧英编写的《实用广州话词典》(1994),麦耘、谭步云编写的《实用广州话分类词典》(1997),郑定欧编写的《香港粤语词典》(1997),白宛如编写的《广州方言词典》(1998),张励妍、倪列怀的《港式广州话词典》(1999)等等,都很受大家的喜爱,这些词典大都多次重版或者增订过。

除此之外,还有不少人士(包括外国传教士)也都编纂了为数不少的粤方言词典,如何类思的《常用粤语字词》(1909),蔡家文的《粤音字词选辑》(1963),高利士的《粤语辞渊》(1965),刘锡祥的《实用粤音词典》(1977),黄丽丽、周澍民、钱莲琴的《港台语词词典》(1990),吴开斌的《简明香港方言词典》(1991),朱广祁的《当代港台用语辞典》(1994)。

(2)粤方言和其他语言(方言)对照词典

由于香港、澳门两地曾分别为英国和葡萄牙的殖民地,因此粤英和粤普对照词典在港澳曾经非常流行。这些粤外对照词典有的是外国人(不少是传教士)编的,如迈耶·伯纳德和温比·西奥多编的《粤英学生词典》(1935)、威礼士(1941)编的《人人粤语》(附英粤词典)、高美士编的《粤葡辞典》(1941)和《葡粤辞典》(1942);有的是中国人编的,如蒋克秋编的《实用英粤辞典》(1940)、黄伯飞编的《粤英英粤词典》(1970)、关杰才编的《英译广东口语词典》(1990)、杨明新编的《简明粤英词典》(1999)等。

粤语和普通话乃至周边方言对照的词典也有一些,如朱永锴的《香港话普通话对照词典》(1997)和欧阳觉亚、饶秉才、周耀文、周无忌的《广州话、客家话、潮汕话与普通话对照词典》(2005),其中尤以后者的影响为大。

(3)专业粤方言词典及其他

除了通用型词典和对照词典外,还有单位或个人编写了一些专业性极强的粤方言词典,如美国陆军语言学院编制的《粤语军事术语》(1956)和美国国防部语言学院编的《粤语军事基本词表》(1959)、巴伦斯费瑟编写的《英粤药物词典》(1914)、何类思编写的《粤法宗教词汇词典》(1918)等。

还有一些专门记录方言熟语的词典,如许云樵的《南洋华语俚俗辞典》(1961)(包括粤语、客语、闽语的俗语)、魏伟新的《粤港俗语谚语歇后语词典》(1997)以及欧阳觉亚、周无忌、饶秉才编写的《广州话俗语词典》(2010)。

(4)小结

不同类型粤方言词典的编纂对于粤方言的传播、教学以及应用都起到很大的推动作用。由于通用粤方言词典收词量比较大,注音、释义、用字和举例比较谨慎,因此在形音义的推广方面往往具有更大的影响力,我们在讨论粤方言字词规范的时候有必要认真吸收其现有的成果。