数字资源存储、仓储和发布的标准规范建设
上QQ阅读APP看书,第一时间看更新

2.1 数字资源长期保存模型

2.1.1 OAIS数字资源长期保存概念模型

在数字信息逐渐成为信息生产和利用的主流介质的趋势下,数字信息资源长期保存已成为数字图书馆和其他数字信息系统的战略问题。数字信息长期保存,需要保护数字信息本身及相关技术、方法和工具,包括:保存数字比特流,保存数字格式与处理信息,保存数字信息处理环境,保存数字信息的验证和管理机制,保存数字信息的组织利用环境。为了有效实施数字信息长期保存,还需要建立数字信息保护责任体系及相应的选择标准,需要研究开发具体的数字信息更新、技术仿真和数据迁移技术与系统,开发描述数字信息长期保存要求和政策的元数据。然而,数字信息的易更改性、不稳定性、对软/硬件环境的依赖性及其载体寿命的短暂性等,对数字信息的真实性、完整性、长期可读取和可理解性构成了严重威胁。对于如何有效地长期保存数字信息,国际出版界、图书馆界、档案馆界、政府组织及相关研究机构都做了不懈努力。

OAIS是美国国家航空和航天局NASA与美国太空数据系统咨询委员会(Consultative Committee for Space Data Systems, CCSDS)联合制定的标准。该标准旨在对资源的存取和长期保存规定基础概念和参考框架。这个参考模型(见图2.1)阐述了档案信息保存功能的全过程,包括加工、档案存储、数据管理、访问和发布。它同时阐述了数字化信息向新媒体及格式迁移,表述了信息的数据模型,信息保存时软件的角色,以及档案间数字信息的交换。参考模型确定了存档功能的内在及外在界面,确定了这些界面的很多高级服务。

图2.1 OAIS数字资源长期保存概念模型

OAIS体系提出了数字信息资源长期保护所涉及的步骤、功能、信息单元和管理要求。

1.OAIS数字资源长期保存功能概述

(1)接收

接收指从生产者(或者从行政管理控制下的内部要素中)接收提交信息包(submission information package, SIP),并为档案馆的内容存储和内容管理做好准备。功能包括:接受提交信息包;确保提交信息包的质量;遵照档案馆的数据格式和文件标准创造档案信息包(archival information package, AIP);从档案信息包中提取“描述信息”放入档案馆的数据库,并使之随着“档案存储”和“数据管理”而更新。

(2)档案存储

档案存储指为存储、维护和检索档案信息包提供服务。功能包括:从“接收实体”接收档案信息包,并将它们添加到永久存储库中;管理存储体系;更新档案资源的存储媒体;进行例行的或专门的错误检测;提供灾难恢复功能;为满足订购要求而提供档案信息包供用户存取。

(3)数据管理

数据管理指为两类描述信息提供保管、维护和存取服务。这两类描述信息分别是:识别和证明档案资源的描述信息;识别和证明行政管理数据的描述信息。行政管理数据是用来管理档案馆的。功能包括:管理档案数据库的功能;完成数据库的更新;对管理数据库的数据提供咨询并形成反馈结果,最后使这些反馈结果形成报告。

(4)行政管理

行政管理指向档案系统的所有工作提供服务。功能包括:就提交协议与信息生产者谈判;审查提交的信息,确保它们符合归档标准;维护系统硬件和软件的配置管理;提供系统监督功能,如监控和改良档案馆的运作,盘点和报告档案内容,迁移或更新档案内容;负责制定和维护档案标准和政策;提供用户支持;激活存储请求。

(5)保存计划

为监控OAIS环境和提供建议服务,目的是确保OAIS存储的信息能够长期被指定用户群存取,即使原来的计算机环境已经过时。其功能包括:为迁移当前的档案资源而评价档案内容,并且定期建议更新档案信息;为档案标准和政策提供建议;监控技术环境的变化;监控指定用户群的服务要求和知识库的变化;设计信息包模板并提供设计帮助和检验,以使这些模板专门用于“提交信息包”和“档案信息包”的特定提交活动中;设计详细的迁移计划、软件原型和检验计划,以实现“行政管理”的迁移目标。

2.OAIS数字资源长期保存信息模型

内容信息是OAIS作为最初保存目标的信息,它由内容数据对象和表征信息组成。内容数据对象包括物理对象和数字对象。物理对象是一种实实在在的、可以看得见的物体,它传达了一种值得保存和分发的信息,且该信息能够单独使用。数字对象是由一组比特序列所组成的对象。

表征信息的目的就是要将比特流转变成更有意义的信息。表征信息实现这一目的的方法是描述格式、数据结构概念,哪种格式或哪种数据结构用在了比特序列中,由此,使得诸如字符、数字、像素、数组、表格等更有意义。它由结构信息和语义信息组成。

除了内容信息外,档案信息必须包含那种能在不确定的时期内,随着时间的推移而理解内容信息的信息。具有这种功能的特殊的信息对象,合起来就被称为“保存描述信息”。保存描述信息包括如图2.2所示的几类信息。

图2.2 OAIS信息模型

(1)参考信息

参考信息是识别内容信息的信息。它确定一个或更多的机制,为内容信息提供指定的标识符。它还向外部系统(如分类系统、参考系统和注册登记系统)提供标识符,使它们清楚地查阅特定的内容信息。在OAIS参考模型中,除了少数参考信息外,大部分的参考信息都将复制到封装描述中,以方便用户存取自己感兴趣的内容信息。

(2)背景信息

背景信息是说明内容信息与它所处环境之间关系的信息,包括:为什么要创建内容信息,它与现存于其他地方的内容信息对象有什么样的关系等。

(3)来源信息

来源信息是说明内容信息历史的信息,包括:内容信息的起源或来源,内容信息产生以来所发生的任何变化,内容信息产生以来有些什么样的人保管过它。

(4)固化信息

固化信息主要用于检测数据的完整性,或证实关键码,或检验关键码,以保证特殊的内容信息对象免于被不明不白地改动。针对具体的内容对象,固化信息为之提供特殊编码和错误侦察方案。固化信息并不包括完整性维护机制,是由OAIS的基础服务部门提供的。

(5)封装信息

封装信息是一种实际存在的或逻辑存在的信息,它将信息包中的组成部分捆绑或联系在一起,并在具体的媒体上形成一个可识别的实体。

(6)描述信息

描述信息是用来帮助用户查找、分析并定购其感兴趣的信息的。它通常来源于内容信息和保存的描述信息。

OAIS是一个包括人员组织、系统、存档数据的整体,它的责任是保存信息并且为指定的团体提供服务。由于这个参考模型能够对记录进行精密的筛选、合理的归档、长久的保存与更新,同时该模型还符合ISO国标,从而为数字信息的长期保存提供了最基本的功能描述,以及一个共同的术语和概念框架。