基于“学术单元”的知识组织新框架:“多维度标签”构建研究
上QQ阅读APP看书,第一时间看更新

1.1 文献单元、信息单元和知识单元

从广义上讲,文献单元、信息单元都是知识单元的一种类型,但从狭义上讲,三者各有不同。从时间上来说,文献单元是最早出现的,也是经历了数千年的一个重要的知识管理的单位。信息单元、内容单元是文献单元和知识单元研究中的一个过渡或者中间概念,虽然存在时间不长,但“信息”的概念已经发展为“信息资源”的概念,成为所有文献、信息、知识的总称,并转化为图书馆学的新名称“信息资源管理”。随着知识管理的兴起,知识单元作为知识管理的最重要元素,成为主要的研究对象。由于目前认为知识单元是组成知识的最小单位,故知识单元也被称为知识元。

1.1.1 文献单元

文献从外在形态上讲,自成一个独立性的单元,故文献单元与文献的概念是基本等同的。我们在讨论文献单元时,也可以将文献作为一个相同概念进行讨论。

国家标准对文献的定义是较为权威并具有广泛影响的,GB 3469—83《文献类型与文献载体代码》与GB 379211—83《文献著录总则》均将文献定义为“记录有知识的一切载体”。王子舟认为这个文献的定义存在某些疏漏,指出记录有知识的人工载体很多,除了图书以外,还有钱币、邮票、商周时期的青铜器等。王子舟认为文献必须是专用于传播知识、交流知识的,它在用途、功能上具有知识传播的唯一性,而上述钱币、邮票、青铜器等并不具有传播知识的本身属性。王子舟因而提出了“并非记录了知识的都是文献”这样一个概念,并将“文献”重新定义为“专门记录和传递有知识的人工载体”王子舟,王碧滢.知识的基本组分——文献单元和知识单元[J].中国图书馆学报,2003(1):5-11.,强调其传递知识的功能。这样的定义有其合理性,但我们也可以把国家标准对文献的定义看作是广义的定义,而王子舟的则是狭义的定义。

文献单元以载体形式存在,是一个普遍被承认的观点。同时,也认为文献单元往往以独立的载体形式存在,举例如简帛、图书、光盘等,这个认识却是有偏差的。

期刊中的学术论文是一种文献单元,而且是现实存在的数量巨大的文献单元,而期刊则是由多篇论文集合成的一个独立载体。学术论文之所以被认定为文献单元,其实是根据其外在的独立形式来判断的,如开头为题名,其后为责任者,再则后有文摘关键词,中间是正文,最后是引文。所以论文作为文献单元,与图书的不同点是其不具有独立的载体形式,共同点应该是与图书一样,具有外在的独立形式。

所以图书与论文为代表的文献单元,其共同点是具有外在的独立形式,这种形式或者是物理上的,或者是逻辑上的。国际文献工作标准化组织批准的《文献工作用术语标准:情报与文献用术语(草案)》(ISO/DL 5127)对文献的解释为:“Document,是指在存贮、检索、利用或传递记录信息的过程中,可以作为一个单元处理的,在载体内、载体上或依附载体而存贮有信息或数据的载体。”文庭孝,罗贤春,刘晓英,等.知识单元研究述评[J].中国图书馆学报,2011(5):75-78.从“依附载体”来看,其概念包括期刊论文。期刊论文不具有独立的载体形式,而是“依附”于期刊这个“载体”。所以论文这种文献,虽然不具有独立的载体,但依然离不开载体。

从上述的讨论可以看出,文献的关键内容是载体。如对古籍的修复,其实是指对古籍载体——纸张的修复,载体存在了,载体上记载的知识也就存在了。所以图书馆对文献的管理,其实是对载体的管理;对文献的著录,部分内容是对载体的描述,如文献的大小(以前用开本,现在用书脊长度)、页数;部分内容是对文献出版情况的描述,如作者、出版地、出版社、出版年,等等;只有少部分涉及文献的内容,但也往往只有书名一项。所以图书馆对文献的管理是一种形式上的管理,而非内容上的。随着时代的发展,这种管理已经不能满足需求了,于是出现了信息单元、知识单元的研究。

从广义的知识单元来说,文献单元是一个确定的知识单元,可以作为一个独立的知识单元处理。同时,文献单元包含多个狭义的知识单元,由于不能直接将物理的文献单元中的知识单元提取出来,所以有学者认为文献单元是知识管理的一种间接单元。

1.1.2 信息与信息单元

与文献及文献单元不同,“信息”与“信息单元”两个概念有很大的差别。原始的信息概念主要是指动态的数据和消息,如股市的行情、经济运行的数据、新闻报道等。“信息”一词在图书馆界的广泛运用,与互联网、电子资源等资源形式的出现有关。1992年以来,国内学术界将“情报”改为“信息”,“文献情报”“文献组织”“文献著录”“文献检索”“文献计量”等也相应变为“文献信息”“信息组织”“信息描述”“信息检索”“信息计量”,“信息”开始成为图书馆界一个普遍和通用的概念,并形成广义的信息的概念。这个信息概念包括了文献,也包含了数字资源中概念的数据,还包括了在管理信息时产生的数据,如元数据,等等。经过一段时间的发展,“信息”的概念延伸为“信息资源”的概念,基本成为所有文献、信息、知识的总称。从某种意思上说,广义的“信息”与“信息资源”的概念基本等同。“信息资源”的概念转化为“图书馆学系”的新名称“信息资源管理系”。也有的高校将图书馆学建成的学院从“图书情报学院”改名为“信息管理学院”。这个名称虽然省略了“资源”两字,但与计算学科组建的“信息学院”中的“信息”还是有区别的,还是指信息资源的管理。

“信息资源”,即广义的“信息”概念,与“信息单元”是两个不同的概念。信息单元的概念来源于邱均平的《信息计量学》一书。该书认为随着“情报”一词被“信息”所替代,情报计量学也发展成为信息计量学,同时探讨了计量单元的问题,认为“从计量单元来说,文献计量学已经不仅仅停留在篇、册、本为单位的文献单元的计量上,而开始深入到文献的内部对知识单元和文献的相关信息进行计量研究,如题名、主题词、关键词、词频、知识项、引文信息、著者、出版者、日期、语言、格式等都已成为计量的对象。”邱均平.信息计量学(一):信息计量学的兴起和发展[J].情报理论与实践,2000(1):75-78.虽然其文中没有出现信息单元的名称,但对信息计量学的计量单元进行了罗列。文庭孝在此基础上总结出了“信息单元”的概念,并认为“文献的外形特征及其标识即信息单元,它不是文献本身,也不能有效揭示文献的知识内容,只是我们控制和处理文献的信息标识,便于我们通过信息标识来组织管理文献。”也就是将“信息单元”定义为“表达和获取文献的重要信息线索,独立存在时没有实质性的价值和意义,只有同文献单元结合使用时才能发挥出特殊的作用”文庭孝,罗贤春,刘晓英,等.知识单元研究述评[J].中国图书馆学报,2011(5):75-77.。虽然与知识单元的研究相比,信息单元的研究沉寂得多,但信息单元也有自己的内涵和存在的价值。

与信息单元内容相近的,出现过一个“内容单元”概念。这个概念出现在马费成《科学信息离散分布规律的研究:从文献单元到内容单元的实证分析》马费成,陈锐.科学信息离散分布规律的研究:从文献单元到内容单元的实证分析(1):总体研究框架[J].情报学报,1999(1):79-84.系列文章中。从字面意思上讲,内容单元是与文献单元相对立的,文献单元是通过外在形式识别的单元,而内容单元主要就文献的内容而言。马费成文章中提到“在内容单元(而不是文献单元)层次上的研究基本上是空白”,说明马费成也是将两者对立看待的。但根据文中的叙述“选择文献中的关键词或主题词作为基本计量单元切入科学信息离散分布的研究,即在文献分布规律成既定的情况下,揭示其中所含的关键词或主题词(内容单元)的分布状态”来看,文中提到的内容单元,基本等同于邱均平提到的信息单元,并且马费成利用关键词和主题词进行运算的过程,也基本可以算是信息计量学的过程,故“内容单元”并不是一个新的单元内容。

1.1.3 知识单元

知识单元有广义和狭义两种,文献单元、信息单元都是广义的知识单元。本节只讨论狭义的知识单元问题。

早在1980年,我国科学计量学专家赵红洲先生就曾经提出:“知识单元是已经获得科学共同体认同的,堪称‘粒子’形态的科学概念,它是科学的细胞,科学大厦的砖块。大量的知识单元经过重组,按一定思路可凝聚成知识纤维,知识纤维又可在更高层次上组成复杂的知识系统。”赵红洲.初论“潜科学”[J].潜科学,1980(1):25-28.赵红洲先生堪称我国知识单元研究的倡导者。

我国图书情报学界对知识单元的探讨则略显滞后。1988年,张德芳先生撰文指出:知识单元是寓藏于出版单元(某一文献)之中的,一个出版单元可能贮含一个以上的知识单元。“科学知识单元是科学劳动的产品,是在事物、实物、现象、过程等零散信息基础上,经过系统归纳、分析、整理,能够反映其本质规律的概念、定理或定律。”张德芳.激发和活化凝固在文献中的知识:论图书馆改革[J].四川图书馆学报,1988(6):1-7.这是一个非常有远见的论点。对于知识单元的具体运用,1995年左秀英提出建设“知识单元专题数据库”的意见,并指出知识单元“内容变化很大,它可以是一个简单的结论、一个具体的数字,也可以是一段较长的论述。”左秀英.开发文献知识信息单元的方法和途径[J].江苏图书馆学报,1995(3):47-48.左秀英论文中提出的其实是从文献中提取知识单元的具体做法,并没有过多地从理论上探讨知识单元的问题,但从其论述上看,无不有后来知识单元的影子,该文可作为图书馆界对知识单元问题的一种无意识的指向,体现了我国图书馆员的思考与创新能力。

到了20世纪90年代末,图书馆界终于认识到,如何从文献单元服务深入到知识单元服务,已经是图书馆实践面临着的新的重大课题。

随后的一系列研究,如2003年王子舟在《中国图书馆学报》上发表的《知识的基本组分——文献单元和知识单元》、温有奎在《情报学报》上发表的《知识元链接理论》等重要研究出现后,知识单元及知识组织的研究进入了一个“全民时代”。

具有普遍性的知识单元概念主要认为:知识单元是知识管理、知识计量与知识评价的最小单元。狭义的知识单元目前主要用知识元来表示。知识元是指文献中相对独立的、表征知识点的一个元素,它可以是一段文字、一幅图表、一个公式、一章或一节、一段动画、一个程序等。知识元也往往直指知识产品(图书、论文、专利等)中的概念、论点(观点)、论据(数据、资料)、论证(方法、模型)、结论等知识核心和知识创新点,也可称为元知识。文庭孝.知识单元的演变及其评价研究[J].图书情报工作,2007(10):72-76.温有奎等人对知识元问题进行了大量的研究,其主要贡献在于提出了“知识链”的概念,并在《知识元链接理论》中提出:“文本内容的组织排列,是由一个个独立知识元素的逻辑排序结构。这种独立的知识元素我们称之为知识元,逻辑依存关系称之为知识链。”温有奎,徐国华.知识元链接理论[J].情报学报,2003(6):665-670.这个理论已经被广泛认可。

温有奎将知识元分成两大类10小类,分别是:①描述型,包括信息报道型、名词解释型、数值型、问题描述型和文献引证型;②过程型,包括步骤型、方法型、定义型、原理型和经验型等。温有奎,温浩,徐端颐,等.基于知识元的文本知识标引[J].情报学报,2006(3):282-288.此外,也有不同的分类方法,如将知识元按照知识元表达的内容差别可以分成理论与方法型知识元、事实型知识元和数值型知识元:①理论与方法型知识元包括思想、方法论、公理、原理、定律以及正在探索中的观念、观点、方法与技巧;②事实型知识元包括自然、社会存在和演变的事实信息;③数值型知识元包括各种数据类知识和科学数据,具有数值分析和知识推理功能,其中包含了大量的社会经济数据。原小玲.基于知识元的知识标引[J].图书馆学研究,2007(6):45-47.

上述的分类方法,其实将本书中的信息与知识两个概念的内容都包括在了“知识元”这个概念中。知识元与文献单元共同组成了信息资源。文献单元以具有形式上的独立性及具有载体为特征;知识元则只具有内容的特征,这个内容包括文字、公式、图像等符号对知识和信息的描述,也即显性知识。

1.1.4 文献、信息、知识辨析

文献、信息、知识三个概念是相互穿插的。文献是包含有信息与知识的载体,是具有实物的外在形态的。信息(本节中的信息指狭义的信息概念)与知识是就内容而言,不具有实物性质的外在形态。根据现阶段的理论,信息与知识都被包含在知识单元这个概念中。

相对于信息而言,知识这个概念是比较窄的,在现实中有大量的内容不是知识,而是信息。比如商品的价格、证券的价格、经济运行的数据,等等。信息虽然不是知识,但也是用户想了解的重要内容。信息的主要特征是具有时效性,时效性过后,信息或失效成为可废弃的内容,或转化为知识。当然,只有少部分重要信息,通过沉淀会成为知识。比如,新闻事件的报道属于信息的范畴,大部分新闻都会被时间所过滤而湮没无闻,但部分事件通过时间的沉淀,被判定为重要历史事件,则该事件的发生时间、地点、人物、过程、影响等都会成为知识而被人类社会保存下来。大量的知识并不是由信息转化而来的,而是通过人类对自然和社会的认知,或是通过实验、逻辑推理等方法获得。在本书中,大量产生新知识的活动,被定义为学术活动。