第二节 词汇学原则
现代词典应该尽可能采纳现代词汇学成果,其中应该急于吸收的主要的成果是:词汇单位的同一性和离散性,词汇的系统性,基本词汇研究,词价研究。运用诸如此类成果,就是词典体现了词汇学原则。
4.2.1 词汇单位的同一性、离散性跟词典的条目
词汇单位,跟词典的条目,大体是一致的,而不完全相等。词典的主体条目,等同于词汇单位。
所谓词汇单位,是受制于词的同一性和离散性(斯米尔尼茨基,1954,1952)。
4.2.1.1 同一性(identity),主要指在民族共同语的语言系统里,词的五个“同一”;在语言子系统或言语中又有某种不脱离常体的变异,即变体。
(1) 词的语音同一,指词的语音常体及其变体都属于同一个词。变体指一个词在方言、口语、书面语、古旧语或言语里,可能有多个变体,如声、韵或调的不同,轻音、儿化的不同,等等。在词典中,一般标注读音常体,少数标注语音变体。
(2) 词的形体同一,指词形常体和变体都归属于同一个词。词典一般给出词的书写形式常体,一般不标出古今变体、繁简变体等,常给出异写变体,如“烦琐/繁琐,唯一/惟一,那么/那末”,等等。词形变体,绝大多数是无值,属于规范之列。如上述例子中的前一个是规范词形,《现汉》把它们列为正条,把一个词形作为副条,条目的后面只标示“同××”。如:
【唯一】 wéiyī [形]属性词。只有一个的;独一无二的……也作惟一。
【惟一】同“唯一”。
(3) 词的语义同一,指词义常体和变体具有同一性。词的常体语义(指一个单义词或一个多义词的一个义项)在语言系统里有一个同一的意义,而在言语或组合中可能一个或几个语义变体。语义变体类别较多,如:1)数量变体。“我们”指“我”——“我们认为……”(这种变体常有两种作用:一、表示谦虚,二、减少论断的主观性)。2)显化变体,即在组合中突显一个语义侧面特征。例如“金子”变体:金子般的心——指纯正而诚实;金子般的东西——指贵重;金子般的霞光——指金黄而光亮。德国学者里普加称之为“孳生特征”。3)虚化变体,即在组合中一个语素变成羡余信息(redundancy),其意义变成零。例如“走马上任”(“马”义虚化),“我太明白”(“太”义虚化),“宇宙”(“宇”指上下四方,表示词义;“宙”指古往今来,跟词义无关,意义虚化)。语义变体,种类较多,不能尽列。词典一般只在释义中给出语义常体,舍弃语义变体。只有当语义常体上升到准义位(子义项,俄语词典叫意味),才附在主义项之后。例如:
【领衔】在共同署名的文件上署名在最前,泛指排在第一位……(《现汉》6版)
“泛指……”是附属子义项,《现汉》5版以前没列入。还有的比喻义,还没上升到子义项,《现汉》只有◇形后给出用例,提示这类语义变体。恕不举例。
(4) 词的语法形态同一,指词的语法常体和变体属于同一个词。词的语法意义多指其词性、结构、词法形态、组合特点、句法功能等。在欧洲语言里,词典的条目只列出常体,条目之后偶尔给出特别值得注意的性、数、格、时、体、态等词法变体形态。有些特殊的变体常附于词典正文之后。汉语词典在条目之后,对实词一般只标注词性,偶尔给出特殊的语法提示;对虚词除了标注词性,大多都给出组合或句法特点说明。例如:
【了】 liǎo [动]放在动词、形容词之后,跟“得、不”连用,表示可能或不可能:做得~……衣服干不~。(《现汉》6版)
【了】·le [助]①用在动词或形容词后面,表示动作或变化已经完成。
a) 用于实际已经发生的动作或变化:这个小组受到~表扬……。
b) 用于预期的或假设的动作:你先去,我下~班就去……(同上)。
(5) 词的语用意义同一,指词的语用意义常体和变体都属于同一个词。词的语用意义在交际者和语境的制约下,产生了常体和变体。词典多标示常体(本书用黑斜体表示),偶尔提示变体(本书用斜体表示)。例如:
【顶撞】用强硬的话反驳别人(多指对长辈或上级)。
【攻势】向敌方进攻的行动或态势……◇足球场上,客队的~非常猛烈。
“顶撞”多用于对长辈或上级,这是语用意义的常体;如果用于对旅客、顾客等,就是语用意义的变体。这是受交际者制约。“攻势”则是受语境制约,“攻势”语用常体是用于军事,变体用于体育,把一些军事用语转为体育用语,这是常见的,言语效应是突显尚武精神。如果军事用语经常用于体育,那么语用义就转化为词汇义。例如:
【进攻】①接近敌人并主动攻击……②在斗争或竞赛中发动攻势:快速~到对方篮下。
同一性像一个链条,使词的常体及变体成为一个整体,使一个词的不同意义成为整体。语言学把这一整体叫作词位(sexeme),又叫型(type,其变体又叫例[token]),在词典中按词位或型列出的被解释单位就叫词条。一个个词条,可以概括成“五定”:定音,定形,定义,定态(形态),定用。
4.2.1.2 离散性(discreteness,也译作分离性),在这里指这一性能使词这一单位分离为有明显界限的成分,包括词音、词形、词义、形态都有明确的界限。
(1) 词音的离散性。词音以及词义判别较大的,离散性很明显。词音以及词义判别较小的,也有明显的界限,具有离散性,词典里分为两个词条。“读音不同就该算两个词”(吕叔湘,1987)。例如:
【公道】 ɡōnɡdào [名]公正的道理。(《现汉》6版)
【公道】 ɡōnɡ·dɑo [形]公平;合理。(同上)
【尽量】 jìnliànɡ [动]达到最大限度。(同上)
【尽量】 jǐnliànɡ [副]表示力求在一定范围内达到最大限度。(同上)
(2) 词形的离散性。词形以及词义判别较大的,离散性很明显。词形以及词义差别较小的,也有明显的界限,具有离散性,词典里分为两三个词条。例如:
【鼓惑】 ɡǔhuò 鼓动使迷惑;鼓动诱惑。(《现汉》6版)
【蛊惑】 ɡǔhuò 毒害使迷惑。(同上)
【发奋】 fāfèn ①振作起来;奋发。②同“发愤”。(同上)
【发愤】 fāfèn 决心努力。也作“发奋”。(同上)
【奋发】 fènfā 精神振作,情绪高涨。(同上)
(3) 词义的离散性,指词内义项的分合以及由之产生的义项多少或粗细问题,也是属于颗粒度(granularity)问题。总趋势是,古粗今细。对一个词形代表的所有意义,古人不分有无联系,都分列在一个词形之下。近现代渐渐分成有无联系的两类:有联系的列在一个词形之内,无联系的分列在两个以上的同形异词之下。词典条目分列两个以上的条目,即[L1] [L2] [L3]等。在一条目中,如果有多个义项,总的倾向是:大词典的义项多,中小词典的义项少;普通语文词典分得粗,学习词典分得细;老旧词典分得粗,新型词典分得细。
义项随着义位在演变,或消亡或发展。发展状态的有三个层级:成熟的义项,半成熟的准义项(俄国人叫“意味”),刚露苗头的带趋向性的用法(俄国人叫“特用”)。三个层次,反映不同程度的离散性。
制约词义离散性的主要因素,也就是义项划分主要依据,有:①词的语法意义,组合和功能特点;②词的所指的差异;③动词变化或行为的差异;④施动者的差异;⑤受动者的差异;⑥形容词的性状差异;⑦形容词修饰限制对象的差异;⑧词的组合功用及常见成分。
(4) 形态的离散性,指词的词性、构词类型、性、数、格、时、体或态之间有明确的界限。每一个词表现的形态及其变体,都有明确的界限。就词性说,各词之间、一词之内的词性都基本存明确界限。其间的模糊地带在词类活用及兼类。至晚在汉初,就知道“伐”有“长言”“短言”异读,跟“伐人”“见伐”用法相关(《公羊庄公二八年传》)。宋代有了《群经音辨》,清代段玉裁称兼类现象之一为“体用同称”。希腊学者发现言语中有词类交叉变则。早期英语,尤其在莎士比亚及其以后的作品里常见名词用做动词、形容词、副词,形容词用作副词、名词、动词。
活用,是词在言语中偶然改变词性,承担新功能。现代汉语词类活用的词占总词数不到1%。由活用到兼类,是从偶然到非偶然,从非“常态”到“常态”,其数量界限应该是变性用例达到总用例的25%左右。从活用到兼类常发生在“动→名”,“名→动”,其次是“形→动”,分别占兼类总量的25%、21%、9%还多。
4.2.2 词汇系统性跟词典的条目
词汇的系统性,指词汇个体及其类别之间的有序关系:位置、层级、制约、依存、结构,形成整体系统。
这个体系在辞书中的体现共有11个子系统: (1)核心词汇,(2)基本词汇,(3)一般词汇,(4)口语词汇,(5)书面语词汇,(6)方言词汇,(7)术语,(8)新词语,(9)旧词语,(10)古词语,(11)外来词语。核心词汇和基本词汇都是常用词。对常用词,特别是核心词给予详细的释义,对一般词给予简明释义。外围词多用同义对释,并分别标注〈口〉、〈书〉、〈方〉、“旧”、“古”等。
这样,词汇就划分出三个层次,随之释义也就划分出中心、一般、外围三个梯度。
这是较大的词汇系统、制约着词典的条目系统。还有中小词汇系统也制约着词典条目系统。词汇系统的划分,不尽相同。但是至少有两个中小类是共同的:时间,空间。时间里有:世纪、年代、年、季、月、日、时、分、秒等层,又有四季(春、夏、秋、冬),二十四个节气(立春、雨水……),过去、现在、将来等等。空间里有:上、下,左、右,内、外,前、后,远处、近处,天、地,八方(东、西、南、北、东南、西南、西北、东北)等等。一般词典得按这些中小类词汇系统把条目收录齐全,就是讲究平衡性。当然,学习型词典可以打破这种平衡性。
从18世纪末洪堡特开始,至少有20多位名家研究过词汇系统性,提出过许多系统性范畴。其精神要点是:系统论使人注重了整体,词个体是属于语言整体的。因此,对一个词位(哪怕是外围的、个别的)的正确理解和解释,不能孤立地看词位本身,必须考察词位在词汇系统中的位置、关系等,只有群体系统才能给个体以质的规定性。如果以《现汉》而论,用原型论观点分析,可以得出三个梯次:以4000条核心词和基本词为中心形成常用词汇,以30000多条一般词为主体,以8个分支(4~11)30000多条词语为外围。把任何一个词都看作这个整体中的一个细胞,这样才能从定位到定性。
4.2.3 基本词汇研究跟词典的条目
基本词汇,是核心词和最常用词之和。它先后得到三个学科的关注:18世纪末开始的历史比较语言学,19世纪末开始的语言教学论,20世纪50年代语言结构论。两个多世纪的研究成果主要有:(1)基本词汇的性质有十几个,最主要的它是语言的基础;(2)基本词汇的数量,欧洲主要语言中有2000个左右,汉语有3000多个;(3)基本词汇至少包括11个小类的词汇:a.自然物,b.身体部位,c.亲属,d.生活必需品,e.颜色,f.工具,g.主要变化行为,h.主要性状,i.基本数目,j.必需的空间,k.必需的时间。这些成果反映到词典中就是:它是一般词典条目的中心成员,是释义的重点;它是词典的元语言,是用来解释所有词条的工具词条;它是五类词典收词的主要对象:基础词典,如《英语基础词典》、《法语基础词典》、《德语基础词典》;学习词典,如英、法各种初阶学习词典;教学词典,如《俄语教学词典》;常用词词典,如英、汉各种常用词词典;中小学生词典。
4.2.4 词价研究跟词典释义
20世纪初期,索绪尔提出“价值”:词不仅有“外指义”,而且在语言系统中有“系统义”,即由关系位置决定的“系统值”。Lyons,J.(1995:80)径直把它叫作“sense/内指义”(又译“关系义”),跟“外指义”相对。这只从一方面给词进行价值定位。后来发展到从多方面对词进行价值定位。这种新理论叫“词价”(法语valence lexicale/英语lexical value)。这是1971年加拿大学者Jean-Guy Savard(琼-盖伊萨瓦尔德)提出的对词的4个评价(定义能力[定义其他词]、包含能力[代替其同义词]、组合能力[组合词语]、扩展能力[含义项多少]),后经苏向丽博士(2010)推演,得出10个评价标准,即10个价:认知价,结构价,语义价,兼通价,自由价,使用价(含词频和分布),释义价(在释义元语言中的频次),丰度价(转义的多少),聚合价(同、反、上义词的多少),组合价(组词、语、句的多少)。受其启发,这里构建了以下8个词价:频率价、时域价、地域价、语域价、释义价、丰度价、聚合价、组合价。一个词典作者最好也是词汇研究者。词典作者应该用以上词价考察一些典型词群。例如“靓丽”这个典型词位以及相关词群,以便从多种价值给词定位。
上表数据,频率根据《现当代文学》《人民日报》语料库统计;时域价根据《四库全书》等光盘综合出词产生以来的年代数,10年赋值为1 ;地域价参照《汉语方言大词典》确定,用于一个方言区的,赋值为1,通用的为10,新词还未通用的赋值为8,文言词不通用的赋值为5;语域价根据现代汉语语料库整合,用于口、政、经、法、文、教、媒、军、体、科技等一、二、五个语域的,赋值为1、2、5,通用的为10;释义价根据《现汉》释语中出现次数确定;丰度价根据《现汉》等词典给出该词义项数量确定,含一、二义项的,分别赋值为10、20;聚合价根据《同义词林》等词典整合最佳同义词、反义词数量(最佳,指同词汇系统、同义、同语体、同音节等);组合价根据《现代汉语搭配词典》和现代汉语语料库统计,一个常见搭配赋值为1。时域价、地域价、语域价,也可以合称为“分布价”。以上八种词价的数量之和,就是该词的综合价,价序是综合价的数量次序。从许多价值考察一个词及其相关词群,是比较科学、比较符合事实的价值定位。从价值定位可以看出:价值的中心是人类、“人们”,亦即语言哲学所说的“语言共同体”。各个价值都是以“人们”为中心的:频率价,着眼于人们使用某词的次数;时域价,着眼于人们造词、用词在时间段上的差异;地域价,着眼于人们用词在地域上的差异;语域价,着眼于人们用词在语言使用领域上的差异;释义价,着眼于人们解释词语中使用某词的频次差异;丰度价,着眼于人们用某词表示“所指”或包含义位的多寡;聚合价,是人们长期使用语言形成的聚合团,即某词周围相关词群个体的数量;组合价,是人们长期使用语言形成的组合链,即某词前后搭配词语或义类的数量;综合价,就是人们赋予词的综合价值。
由综合价得出的价序,前一、二位的“美丽、漂亮”,虽然他们产生的早晚有很大差别,但是一直是口语和书面语通用的,有很强的生命力。第三、五位的“亮丽、靓丽”是新造词、新用词,因为它们新颖,必然时兴相当长时间。第四位的“俊俏”是生命力很强的口语词,在许多时空都常见。第六、七位的“昳丽、俏式”是文言词、方言词,在许多时空都见不到,其价序自然排在后面。
总之,要想全面地给一个词语的价值定位,应该在客体、主体世界确定其外指义,在语言世界确定其内指义(系统坐标值),在主体世界确定人们对它的使用值(即词价)。正如维特根斯坦在《逻辑哲学论》开头部分特别强调的,世界是由事实组成的整体,而不是由事物组成的整体。客体世界、语言世界和主体世界的组成,都不是纯客观事物,而是人们所认识的事实、所作所为及其结果、所说的语言。
整体论认为,一个个词语不仅仅属于所在的句子,更重要的是属于以人为中心的事实世界,特别是属于以人为中心的某一语言整体。一个个词语像一只只眼睛,在多样多情的整个脸上笑着;离开这样的脸,无所谓笑着的眼睛。