大数据环境下高校图书馆知识服务模式研究
上QQ阅读APP看书,第一时间看更新

第三节 高校图书馆知识服务中的大数据

高校图书馆知识服务的大数据资源是多种多样,既涵盖期刊、图书和工具书等传统知识资源,也包括各种电子知识资源,如文献数据库、专题数据库、在线知识库、联机知识库等;不仅涵盖了书目信息、声像数据等结构化的知识资源,更包含了用户基本信息、访问行为及服务情况等半结构与非结构化的知识资源。

根据数据来源,高校图书馆的大数据可分为社交媒体数据、系统数据和传感器数据;根据生成类型,高校图书馆的大数据可分为馆藏知识数据、图书馆工作人员的工作数据和用户使用图书馆的信息数据。

一是馆藏知识数据资源。高校图书馆的优势在于拥有大量的馆藏资源和特藏资源,现在高校图书馆馆藏资源主要包括传统的纸质资源和现代数字化资源,其中数字化资源主要包含除纸质图书、期刊和报纸外的纸质文献转换的数字资源、电子书、文献数据库、网络数据库、联盟知识库、联机知识库,以及各类音频、图片和视频等资源,这些资源是图书馆展开服务工作的基础。但是一般来说用户主动获取和利用的资源不多,使得大量的馆藏资源没有被充分利用,而且随着信息技术的飞速发展,用户获取知识的途径和手段也越来越丰富,这也会导致大量图书馆资源处于闲置状态。因此,在开展知识服务的过程中,通过馆藏资源数据寻找相关性、揭示规则或发现新知识是关键环节,在实践中也要从图书馆资源观和数据的维度对馆藏资源进行分析和处理。

二是图书馆工作人员的工作数据。新时代高校图书馆数字化、网络化和自动化的工作手段,明显提高了工作效率,同时也产生了大量数据,使管理者可以掌握工作人员及业务处理流程。其主要涵盖图书馆工作人员在工作过程中发生和保留的数据,例如借阅信息中的预约借阅、委托借阅及馆际互借等图书馆工作人员与用户之间的交互信息,这些数据属于工作信息的一部分。一方面能够反映读者利用图书馆馆藏资源的情况;另一方面能客观反映读者的阅读倾向和阅读偏好,及时了解读者需求的变化和各类图书的供求状况,便于为用户提供个性化的知识服务。咨询信息中的图书馆工作人员对互动的信息记录,通过记录和统计功能形成了结构化的咨询交互数据。留言板、基于Web的表单、实时聊天或即时消息、电子邮件等都是图书馆大数据的一部分,从大数据的视角去考虑和分析,这些咨询信息对研究用户偏好、评估咨询质量和效果、开发咨询新业务等方面都具有重要的现实意义。采访工作是图书馆知识资源建设的基础,其过程中会产生大量包括书籍供应商提供的书目数据、采购数据、入馆数据及入馆使用率等采访数据,充分利用现有的采访数据可以为后来的采访工作提供依据,也是图书馆选择书籍供应商的重要依据。因此,采访数据不仅是采访工作的着力点,而且对图书馆知识资源建设发展方向和选择最佳采购方案提供了重要的参考依据。编目数据不仅包含书目数据,还包括与编目工作相关的数据,尤其当编目数量大量外包之后,对外包编目员的管理和书目数据的质量控制就成了编目工作的重点。这些数据可以帮助管理者评估和分析外包工作的效率和质量,以便制定更加合理的人员管理和质量把控策略。

三是用户使用图书馆的信息数据。用户在使用图书馆资源的过程中,产生了大量的数据,包含传感器数据、用户的网络行为数据及科学研究数据。第一,传感器数据。图书馆内不同位置的传感器采集了各类馆内资源数据,如门禁系统储备了大量的用户进出馆信息,用户到馆学习、参观及参与图书馆组织的各类比赛的行为记录。第二,用户的网络行为数据。如搜索、点击流、网站以及社交网络服务(SNS)是产生用户网络行为数据的典型数据源,其数据产生量高速增长。自21世纪初期以来,从博客、论坛及社交媒体网站等在线社交网络中产生了大量用户交互信息,其交互内容丰富,包含大量对图书馆服务的评价信息,体现了强烈的用户情感倾诉内容,为图书馆完善其服务提供了重要依据,是值得图书馆重视的重要数据源。伴随高校移动图书馆的广泛普及,校内用户可以通过智能手机和平板电脑等移动网络设备直接登录校内的网络智能图书馆系统,由此图书馆以移动互联技术作为技术支撑更加便捷地获取用户浏览数据。此外,联机公共目录查询系统(OPAC)也是图书馆大数据的重要来源之一,囊括了用户访问、检索、下载等丰富的行为记录。第三,科学研究数据。该数据同样是图书馆大数据的重要来源之一。科学研究数据是指在科研过程中,高校的不同机构、课题组的研究人员生成的任何可以存储在计算机上的数据,主要包含调研和实验数据,此外也包括来自模型测试的仿真数据、传感器或遥感勘测数据以及神经图像等可以转换成数字形式的非数字形式数据。

在大数据环境下高校图书馆的数据环境发生了巨大的变化。大量的入馆数据以及图书借阅数据,文献数据库、在线数据库、联盟知识库等访问数据随之产生。简单的数据统计分析无法获取数据中蕴含的更有价值的信息。利用数据挖掘和可视化技术对这些大数据进行挖掘分析,可以研究图书馆个人用户及群体用户的行为特征,从复杂冗余的图书馆数据中深入挖掘用户入馆、借阅等行为背后的特征和有价值的信息,寻找其中的特点与关联,并以此为依据对改进图书馆现有功能提出实用和有效的建议,帮助高校图书馆推出更贴近用户使用习惯的管理制度,快速提升图书馆的用户体验,同时有利于高校图书馆合理配置图书资源以提高服务质量。

通过对图书馆数据的挖掘,可发现很多有价值的知识信息。如通过对图书借阅数据的分析,可以判断用户喜欢的图书类型、为用户推荐感兴趣的图书,并进一步探讨图书资源的使用现状等。对入馆数据的挖掘分析,可以了解用户入馆规律、用户关系、图书馆的使用现状等。

随着高校图书馆用户知识需求的增加和对知识服务要求的提高,高校图书馆传统的服务手段和方式已经很难适应用户的需求,在大数据时代,必须要充分利用现代大数据技术,对自身拥有的大数据进行深度挖掘,充分满足用户的知识需求。

与大数据的基本特征相同,高校图书馆知识资源数据的数据量大,类型多样,结构复杂。因此,高校图书馆必须借助大数据技术,从数据量大且类型多样的大数据中挖掘潜在价值,为用户提供知识服务。