1.3.2 国内研究状况
1.3.2.1 有关原生数字资源的研究
国内对于原生数字资源研究较早的一篇论文是2006年阙晓萌和施强写的《论大学图书馆原生数字信息资源服务平台的构建》。在CNKI的专业检索框中输入检索式“TI= ‘原生数字资源’+ ‘原生数字信息资源’”进行搜索,共查找到29条结果,其按年份分布如表1-1所示。搜索结果表明,2006年之后国内才出现一些关于原生数字资源的论著。利用CNKI的“学术趋势”搜索功能,对与“原生数字资源”关键词相关的论文情况进行分析,原生数字资源的学术关注度正在曲折上升,其结果如图1-1所示。
表1-1 29篇论文的年份分布
注:数据截止到2013年4月13日。
图1-1 原生数字资源的学术关注度
注:数据截止到2013年4月13日,纵坐标表示各个年度下与关键词相关的文章收录数量。
文献查阅表明,国内对于原生数字资源的长期保存、原生数字资源的管理和建设、原生数字资源子类型等的研究关注较多。
(1)原生数字资源的长期保存
刘钊等三位学者从技术问题、政策法律和管理机制三个层面阐释了国内外数字资源长期保存的现状;通过探讨对于数字资源应该采取全部保存还是选择性保存的问题,强调在原生数字资源生产过程中应注重对中间信息的保存;提出了解决中间信息保存问题的方案:进行开放互动式原生数字资源生产以促进中间信息的保存,或者借助于软件功能实现保存,并通过宣传教育措施、经济和法律调节手段引起人们对于中间信息保存的重视。原生数字资源的长期保存是开展科学研究至关重要的前提和基础。邓李君论述了国内外数字资源与原生数字资源保存研究现状,分析了原生数字资源保存所面临的障碍——载体、版权、隐私问题、作者的认识、原生资源的种类与容量、保存机构的稳定性与设备的持久性,提出了原生数字资源的保存策略——打破封闭的教育与培训意识、保障相关人员与企事业单位的利益、执行统一的遴选标准、推行政府等多方的联合存储、由政府牵头及给予政策支持。戴艳清主要从经济视角探讨了原生数字资源的长期保存问题,分析了影响数字资源长期保存的成本要素,指出目前国内数字资源长期保存面临的主要经济障碍——长期投入与短期收益的不平衡、潜在利益关系的冲突、数字信息生命周期的管理链断裂、我国数字资源长期保存项目之间大多存在交叉重复问题等,并介绍了国外数字资源长期保存的经济策略对于我国的启示。
(2)原生数字资源的管理和建设
常娥和袁曦临在介绍国内外学者对于原生数字资源理解的基础上,从原生态角度对原生数字资源的概念进行定义,提出以国家图书馆为首各级图书馆联合的异地分布式的原生数字资源长期保存管理模式,从资源评价指标、资源的采集和组织描述、资源长期保存和资源检索利用等视角研究了原生数字资源的管理技术问题。他们还在阐明原生数字资源网络信息伦理问题研究意义的基础上,从信息产权、信息存取权、信息隐私权和信息精确度四个层面剖析了原生数字资源信息伦理的内涵,并重点阐述了原生数字资源伦理问题的核心——原生数字资源保存权问题。
(3)原生数字资源服务、平台的构建
阙晓萌和施强用到了“原生数字信息资源”的提法,分析现行出版制度所引起的信息资源生产者在利用自己的信息产品时面临的付费悖论,通过对原生数字信息资源现状的分析,论述如何构建机构知识库服务平台:分析机构知识库的理念,阐述机构知识库的作用——学术传播、原生数字信息资源管理和原生数字资源共享利用,指明机构知识库管理与服务需要解决的几个问题——原生数字信息资源的版权问题、原生数字信息资源获取难问题、原生数字信息资源管理问题等,从认识、规范、产权三个角度提出规范机构知识库管理与服务的对策。朱明莉从高句丽学术文化发展和国际政治文化发展两个角度阐明了搭建高句丽原生数字资源库的意义,从地理、资源、技术、人才四个方面阐释了通化师范学院图书馆在构建高句丽原生数字资源知识库上的优势和条件,对高句丽原生数字资源知识库的资源存在形式、资源采集、资源加工整理、知识库分类、知识库编目、知识库结构、知识库设计、知识库管理与维护、知识库查检等进行了阐释,对实现真正意义上的知识库的构建提出新的看法、措施和建议。但朱明莉并未指明原生数字资源的含义。计云倩以苏州大学图书馆工作为蓝本,说明了古籍文献资源保护与开发利用和原生数字资源建设工作的现状,提出了原生数字资源开发和建设的主要方式——机构知识库、学位论文数据库、网上报告厅、特色数据库,不过,她将原生数字资源理解为苏州大学图书馆所独有的数字资源,与大部分学者对原生数字资源的理解差异较大。马海兵、任龙和范颖捷为让全军范围内的政治工作信息资源得到良好的建设和发展,提高政治工作信息资源的利用效益,在开放存取理念的指导下,提出构建军队政治工作原生数字资源交流与共享平台;此平台为数字化和网络化处理政治工作传统资源、整合政治工作理论资源、深度挖掘利用政治工作实践经验、充分发挥社会网络资源的作用,提供了良好的支撑。
(4)原生数字资源的有关研究项目
与原生数字资源有关的研究项目有:东南大学申报的教育部人文社会科学基金资助项目“中文原生数字资源管理研究”(项目编号:08JC870002);上海市哲学社会科学规划项目“军队政治工作原生数字资源开放平台建设研究”,(项目编号:2009BZH005);湘潭大学编号为0509008的校级项目也与原生数字资源有关。
此外,欧亮从原生数字资源加工处理流程的视角出发,对原生数字资源准备、原生数字资源收集加工、原生数字资源存储和保存、原生数字资源获取利用等不同阶段的研究状况进行总结和归纳,并简要阐述了组织合作的重要性。
(5)不同“产地”原生数字资源研究
在“网络原生数字资源”这一提法出现以前,国内一些学者就已经开展了原生数字资源的子类信息资源研究。基于不同视角对原生数字资源子类型的划分不同,从展现形式的视角划分,以博客资源、微博资源、BBS资源、播客等为例,在CNKI中查找直接研究这些子类型资源的文章,结果如表1-2所示。在高级检索框中输入的检索式分别为:TI=“博客资源”+“博客信息资源”+“blog资源”+“blog信息资源”+“BLOG资源”+“BLOG信息资源”; TI=“微博资源”+“微博信息资源”+“microblog资源”+“microblog信息资源”; TI=“BBS资源”+“BBS信息资源”+“bbs资源”+“bbs信息资源”+“电子公告板资源”+“电子公告板信息资源”+“电子公告板资源”+“电子公告板信息资源”+“网络论坛资源”+“网络论坛信息资源”; TI =“维基资源”+“维基信息资源”+“wiki资源”+“wiki信息资源”+“维基百科资源”+“维基百科信息资源”; TI=“播客资源”+“播客信息资源”+“PODCAST资源”+“PODCAST信息资源”+“podcast资源”+“podcast信息资源”。
表1-2 部分原生数字资源子类型的研究文章数量分布
查阅表明,文章中有对博客资源的组织研究,例如,陈志新的论文《博客(Blog)资源的信息组织》、冯向春的论文《论国内图情博客资源的组织建设》、吴昌合和叶丹的论文《谈博客(Blog)资源的信息组织》、李楠的论文《论国内档案博客资源的组织建设》、姜化林的论文《网络博客资源的CNMARC编目探析》等;有对博客资源的应用研究,例如,杨晓峰的论文《教育视域中的博客资源》、李海燕的论文《博客资源在高校统战工作中的应用初探》、江泳和李海燕的论文《浅谈高校统战工作中博客资源的应用》、康微的论文《从小世界理论分析网络博客资源对图书馆参考咨询服务的创新意义》等;有博客资源的存取研究,例如,谢春枝的论文《博客资源长期存取的困境探析》等;有博客资源的评价研究,例如,李小霞和李力的论文《医药学术性Blog信息资源的评价》等;有博客资源的现状研究,例如,彭剑芳的论文《对我国图情领域个人博客资源的调查分析研究》等;有博客资源的爬取和挖掘研究,例如,许雁鸣的论文《博客资源的爬取与检索》、轩文烽的论文《面向主题的博客资源挖掘关键技术研究》等;有微博资源的议程设置研究,例如,罗子欣的论文《城市形象传播中微博信息资源的议程设置》等;有BBS资源的分布与利用研究,例如,王华的论文《华侨华人网络论坛信息资源的分布与利用》等;有播客资源的平台研究,例如,杨公义的论文《基于SSH的博客资源平台的设计与实现》等。
再深入分析对原生数字资源子类型的不同侧面的研究,代表性的论述有:邱均平和李江介绍了博客链接索引(Blog Citation Index, BCI)的背景、理论和数据库结构,分析了BCI的查询与统计功能,阐述了BCI在网络计量学、数据挖掘、搜索引擎等方面的应用;邱均平等还从博客计量学的视角,在分析PageRank算法缺陷的基础上,提出改进的博客计量算法——BlogRank算法,以453个情报学学术博客为例,分析了BlogRank算法的运用,提出了BlogRank算法在图书馆博客中的评价和搜索应用;金燕博则从新闻源开发和利用的角度对博客进行研究,阐述了名人博客、普通社会个体博客、新闻记者博客等几类博客新闻源,分析了博客作为新闻源的便利之处——打破时空限制、使新闻发现活动由被动转向主动、整合和深度挖掘网络新闻资源等;刘莉等设计了基于RSS技术的博客采集系统,利用爬虫获取用户RSS地址,并对每个RSS地址进行垂直搜索;吕学强等借助中文分词、词语碎片组合、频数统计、词性过滤等技术,提出一种针对BBS中文新词语进行自动挖掘的统计与规则相结合的方法;蒋凡等通过计算词语在回帖传播链上的影响力,采用对影响力词语聚类的方法,发现BBS论坛中具有影响力的主题,从而设计了BBS主题发现原型系统;等等。这类文章比较多,限于篇幅,不一一列举。下面仅就比较典型的两大类原生数字资源研究情况进行详细介绍。
①原生数字期刊
阮建海和郭刚在介绍原生数字期刊和Open Access期刊含义的基础上,从产生背景、发行方式、出版模式、版权形式、质量控制等方面对原生数字期刊与Open Access期刊进行比较,对两者的发展趋势进行了论述,提出了原生数字期刊长期保存和综合利用的问题。郭刚和阮建海在阐述原生数字期刊含义的基础上,分析原生数字期刊导航系统现状,提出构建综合性原生数字期刊导航系统的重要性,对综合性原生数字期刊导航系统的构建工作提出以下建议:提高资源搜索和采集的完整性,促进原生数字期刊学术交流、自动搜集与人工判断相结合,提供全文下载及电子出版服务。郭贵梅从原生数字期刊获取成本、出版周期、学术价值等视角说明原生数字期刊馆藏的优势,介绍分析北京大学、厦门大学、香港科技大学等大学的图书馆在学术原生数字期刊馆藏建设方面的情况,阐明原生数字期刊馆藏建设的一般程序:确定主题、筛选和组织整序、开发利用、修改维护。郭刚在其硕士学位论文《Web2.0环境下学术原生数字期刊导航系统构建研究》中,论述了原生数字期刊与Open Access期刊的比较、web2.0环境下学术原生数字期刊导航系统的构建、web2.0环境下学术原生数字期刊导航系统部分功能模块的实现等内容。蒲雷在其硕士学位论文《中文原生数字期刊馆藏建设模式研究》中,阐释了中文原生数字期刊馆藏建设内容及流程、中文原生数字期刊馆藏建设模式构建、中文原生数字期刊馆藏建设模式的选择分析等内容。郭贵梅在其硕士学位论文《原生数字期刊馆藏质量控制研究》中阐明了原生数字期刊来源及质量、原生数字期刊馆藏开发状况、基于评价指标体系的原生数字期刊馆藏质量控制,并进行了实证检验。
在研究项目方面,有西南大学阮建海教授领头的国家社会科学基金项目“原生数字期刊馆藏建设模式研究”(项目编号:09BTQ011)。
②网络原生数字资源
研究综述。陈红星、张淑芳和郑琳等从“原生数字”宏观角度和原生数字资源子类型微观角度对国内网络原生数字资源相关文献研究情况进行数据统计分析,从网络原生数字资源的内涵、资源规划、资源评价与采选、资源组织、资源长期保存五个方面进行了总结,指明网络原生数字资源研究中存在的两个不足:理论研究系统化不足和不能独立于网络数字资源研究。
网络原生数字资源的定义和类型。陈红星和张淑芳对网络原生数字资源的概念和内涵进行阐释,认为网络原生数字资源是网络数字资源发展的高级阶段,提出网络原生数字资源的独有特点:网络原创性、数字形式唯一性、极易灭失性等,并根据应用形式、组织形式、存取形式、搜索引擎收集程度、资源提供途径、载体形式、出版形式等标准对网络原生数字资源进行分类讨论。夏南强和李倩在给网络原生数字资源下定义的基础上,基于呈现形式、信息公开程度、信息存储格式、产权归属、终端设备等视角对网络原生数字资源进行分类探讨,提出网络原生数字资源具备杂糅性、原创性、脆弱性和开放存取性等特点。陈宁从网络原生数字资源收集方式、建立网络原生数字资源动态虚拟数据库、加强馆际和国际交流、利用会议专题网站搜集信息等方面阐释了web 3.0环境下网络原生数字资源的搜集与开发,从web 3.0的推送服务、网络原生数字资源的开放存取、网络原生数字资源的联合开发利用等视角探讨了web 3.0环境下网络原生数字资源的整理与利用。李澍从应用形式、生产途径和发布范围、组织形式等角度对网络原生数字资源的类型进行划分,探讨网络原生数字资源的特点——网络原创性、高度共享性、不易保存性、不安全性,提出了有关网络原生数字资源组织和检索利用的建议。
网络原生数字资源的开发、资源建设。夏南强和李倩从网络原生数字资源价值提升的角度阐述了网络原生数字资源开发活动的内涵,思索与探讨了网络原生数字资源的开发活动,从经验与知识分享、娱乐交友服务、历史回溯和转移转化等视角阐述了网络原生数字资源开发问题。李倩在总结国外组织机构对于网络原生数字资源的不同理解的基础上,论述了网络原生数字资源的内涵,从资源的社会和经济功能发挥的视角,阐明了网络原生数字资源开发的含义,重点阐释了网络原生数字资源开发的基本环节:开发阶段、分析与定位阶段、网络采集与长期保存阶段、再组织与深度挖掘阶段、利用与反馈阶段等。莫再英认为,网络原生数字资源为网上最初始的资源,它具备原始性、无产权性、分散性、免费性等特点,网络原生数字资源的组织对数字馆藏建设具备丰富图书馆数字馆藏、弥补图书馆数字馆藏资源的不足、传承社会文化、改变现有图书馆的工作模式和服务模式等意义,应遵循紧密结合馆藏体系、满足读者需求、注意版权问题等原则来组织网络原生数字资源,可采用网络导航和信息资源重组等组织方法。陈红星和张淑芳从资源形成的视角指明网络原生数字资源建设的概念,从人类需求、信息公平、信息污染、人类文明保存的视角分析了资源建设的宏观必要性,从资源的原创性、资源基于数字形式的唯一性、资源极易灭失性等视角论述了资源建设的微观必要性,并从思想意识、理论基础、实践经验、技术基础等方面分析网络原生数字资源建设的可行性。肖时占等分析了独立建设模式和共享联盟建设模式、“三个中心”建设模式、网络原生数字资源与非网络原生数字资源混合建设模式对网络原生数字资源的影响及各自的优缺点,提出了“纯网络原生数字资源建设模式”“以机构原生数字资源库建设为基础,实现网络信息资源共享联盟与自主建设协调发展”“以人为本,以用户信息需求为中心构建网络原生数字资源建设系统”三个网络原生数字资源建设模式的优化设计。易祖民、雷素芳和陈红星从宏观和微观两个视角阐释了网络原生数字资源的组织模式,其中,微观组织模式包括自组织模式、搜索引擎模式、超媒体组织模式、数据库组织模式等,宏观组织模式包括网络学科资源导航模式、网络学科信息门户模式、数字图书馆、网络资源指南等,并提出了网络原生数字资源组织模式的两大发展趋势——在开放存取环境下进行和资源共建共享。郑雯译和毕艳芳针对网络原生数字资源的独有价值,提出高校图书馆整合与利用网络原生数字资源的必要性,对整合过程中的几个重要环节:资源类型的选择、资源质量的评价、资源内容的整合与揭示方式等展开较为深入的探讨。毕艳芳、郑雯译和秦鸿从分类采集、评价筛选、组织揭示、宣传利用、后期维护五个阶段对重点学科网络原生数字资源导航平台建设进行系统的分析和阐释。毕艳芳和郑雯译对电子科技大学图书馆在CALIS重点学科网络原生数字资源特色库建设方面已经完成的分类采集阶段、评价筛选阶段、组织揭示阶段所取得的成果进行介绍,对项目进行过程中所取得的宝贵经验进行总结,提出了对未来工作的规划和展望。
网络原生数字资源的管理。常娥和袁曦临从社会文化的传承和图书馆的生存发展角度论述了网络原生数字资源管理的意义,介绍了国内外的相关研究项目,从原生态视角提出了网络原生数字资源的概念和范围,从保存、管理、评价、产权和政策等角度重点探讨了网络原生数字资源管理方面的问题。
网络原生数字资源的评价。常娥和魏彬在论述网络原生数字资源概念、特点和类型的基础上,总结分析国内外现有网络资源评价所采用的方法和取得的研究成果,围绕文章总数、回帖数、发文周期、浏览次数、外部链接情况、依托网站等级得分、下载次数、存在时间八个定量评价指标,建立了评价指标体系,并利用该指标体系对Wordpress和blogbus网站的博客进行了实证分析研究。
相关研究项目。2002年1月18日,为了顺利完成国家“973”和“985”项目的任务,北大网络实验室(现为北京大学网络所主管)开始建设“中国Web信息博物馆”。其不断抓取中国互联网上的网页(2012年11月20日23点03分以4611篇/分的速度进行抓取),将获得的海量网页信息进行初步加工和组织,并以档案的方式储存起来。“中国Web信息博物馆”致力于有效地保存中国互联网上曾经出现过的历史信息,为大众提供中国历史网页浏览服务,成为中国网页信息存储与展示系统,成为我国大型的信息资源库,进而为多学科的研究以及其他应用提供基础性的信息支持。原生数字资源是该项目保存的主要资源之一。该项目的原生数字资源为本研究的进行提供了良好的资料基础。此外,湖南省高校图工委科研项目“网络原生数字资源与高校图书馆数字馆藏建设研究”(项目编号:2009L018)、湖南省教育厅科研项目“网络原生数字资源运动规律及组织模式研究”(项目编号:10C1082)、怀化学院一般项目“高校图书馆网络原生数字资源建设研究”(项目编号:HHUY2011-47)、电子科技大学图书馆CALIS三期专题特色库子项目——“物理电子学与光电子学网络原生数字资源建设”(项目编号:4401-SC -401)等项目为地方和高校科研项目。2009年,国家社科基金将“网络原生数字资源与数字馆藏建设研究”纳入图情档案类的项目指南之中。这些可以反映出国内学者对网络原生数字资源的研究越来越关注。
国内对网络原生数字资源的研究中虽然不乏建设性的尝试,但存在系统性不强和独立性不够的问题,研究的广度和深度尚待扩展和加深。