CADAL数字图书馆知识标准规范及应用研究
上QQ阅读APP看书,第一时间看更新

第3章 知识元抽取

随着互联网的飞速发展,人们每天创造着海量的信息。现有的知识组织方式组织的是知识的载体——文献,而非知识本身,只能保证检出的文献含有所需知识,并不能揭示这些知识之间的联系,即不能检索出潜在的知识。在数字图书馆信息检索的服务系统中,可以通过标题、关键词、作者、内容分类特征等元数据进行关联检索,然而我们从检索出来的结果中并不能直接得到要解决问题的知识,即不能全面、快速、准确地为用户提供解决问题的知识信息。对于学术研究者而言,从海量文献中查找其研究领域相关文献的过程已让他们显得比较疲惫,若是再从搜取的文献中继续筛选出对其学术研究有帮助的知识,则需继续花费大量精力。因此,从信息检索的角度来看,知识信息的基本单位急需由以文献为单元演变到以知识元为单元,从而使得知识元的抽取工作成为非常有意义的事情。

通过从文本中抽取知识元,使文本知识的控制单元深入知识元和知识元间的链接与共享,实现文本知识的增值转化,是信息服务向知识服务过渡的一种有效方法。对于海量的学术资源,若知识的控制单元由文献深化到知识元,把文献分解为一个个独立的知识元,这样一方面便于存储与查找,用户可以直接查找知识元,以创造新的知识,并加速知识的创新,另一方面将会揭示文献中包含的知识元及相关领域之间的链接关系,从而产生新的知识单元,实现知识的增值转化,同样能加速知识创新的速度。知识元的研究,对推动人类对知识的利用以及对新知识的创造的进程有着至关重要的作用。另外,海量学术资源的知识元研究,为知识管理中处理知识方法的研究开辟了新思路。知识管理就是通过对确定有效的知识单元进行处理以达到知识服务、知识发现和知识创新的目的。知识元作为知识单元的组成个体单元,以此学术文献就可表示为一个知识单元,其知识结构涉及多个知识元,这样对学术资源的处理对象将由文献深入知识元,更有助于推动处理、组织、发现及利用学术资源知识的方式的转变,如知识表示、信息检索及学科标引等,可以更有效地对知识单元进行处理。同时通过知识元链接,可实现对文献信息深层次的挖掘,将信息的组织深入知识层次,对知识管理、知识服务产生深刻的影响。围绕知识元进行的相关研究工作,对实现人类知识的有效组织、有效阅读、有效使用具有一定的理论意义和实践意义。

总而言之,结合学术资源开展研究知识元的工作意义重大,而知识元抽取作为研究学术资源知识元的基础工作,同样具有很重要的意义。