电子文件长期保存:理论与实践
上QQ阅读APP看书,第一时间看更新

第二节 电子文件长期保存的概念及认识误区

一 电子文件长期保存的概念

电子文件是数字遗产的一种类型。联合国教科文组织《数字遗产保存指南》关于数字保存(digital preservation)的定义是“数字保存是对以数字形式存在的信息和其他类型遗产的保护过程”。[1]英国国家档案馆数字保存联盟JISC、澳大利亚国家档案馆对数字保存的定义相同,即“数字保存是指为了确保数字对象在未来能被我们获取和利用而对其采取的主动管理过程”。[2][3]以上对数字保存的定义覆盖了所有类型的数字对象,其中,电子文件与其他数字保存对象相比,具有对形成机构和组织的凭证价值,因此,对于电子文件而言,文件的真实性是对其进行长期保存的基本前提。ISO 15489-1对文件保存的定义如下:“文件保存(preservation)是确保真实性文件的技术和内容的长期保存的过程及操作”,即文件的长期保存涉及两个方面:文件形成的技术要素(如存储载体、存储格式等)和内容要素。传统纸质档案和电子文件在技术和内容方面的长期保存存在较大的差异性。纸质档案的内容、结构(格式)和载体是固定的,一旦形成不可转换或改变。因此,纸质档案的长期保存主要是针对其载体和内容的原生性或原貌的维护和保持。而电子文件长期保存的技术要素和内容要素较为复杂,传统的“原生性”或“原始记录”概念不再适用于电子文件,因为“原始”的电子文件是以计算机编码形成和组织的,而呈现在显示器上的我们可以理解和识读的电子文件信息内容则是经过计算机软件“编译”而成,已经不是其“原件”。而且,电子文件可以在不同载体间转换,可以有若干数字副本,同时在不同的客户端显示和操作。因此,确切地说,从“原生性”或“原始记录性”角度来理解和实现电子文件长期保存不是很适用,电子文件长期保存应该是对其真实性、完整性、可靠性和可用性的长期保障。为此,在电子文件长期保存过程中,必须全面考虑文件的三个基本构成要素,将电子文件的背景、结构与电子文件的内容一起保存,为电子文件长期保存奠定基础。澳大利亚国家档案馆《电子文件长期保存指南》(2002)分析了电子文件与传统档案的不同特点,并对电子文件长期保存的方式提出了建设性意见,值得我们参考和借鉴。[4]

二 电子文件长期保存面临的挑战及认识误区

电子文件长期保存面临严峻挑战,最主要的威胁来自两个方面:技术过时和存储介质物理性能的退化。传统纸质档案如果保管条件得当可以留存几个世纪,但是电子文件对载体及所生成的数字环境依赖性很强,而计算机技术发展日新月异,由于技术更新、软硬件环境的变化和载体老化而导致电子文件内容无法读出的状况令人担忧。具体而言,电子文件长期保存面临如下挑战:①电子文件对机器的依赖性。电子文件在数字设备和环境中产生,必须依赖特定的计算机硬件和软件才能阅读和处理。②技术过时是电子文件长期保存的最大威胁。技术更新的周期越来越短,可能仅有2~5年,这要求人们必须在下一个技术更新周期来临之前就采取对电子文件的保护行动,否则难以保证电子文件内容能够在不断更新的技术环境中长期可读、可用。③存储介质的脆弱性。即使在存储介质并无受损的情况下,介质本身的不稳定性和不适宜的保管条件也会使其物理性能快速退化。④为了应对上述技术过时和载体退化的挑战而采取的一些措施又可能会对长期保持电子文件的完整性和真实性产生影响。⑤应尽早采取电子文件长期保存行动,否则数字信息内容会在极短时间内丢失或无法读出。⑥应采取基于文件生命周期的管理方法对电子文件进行维护。⑦此外,电子文件长期保存还面临着法律、制度及经济问题。为了实现电子文件长期保存,应该在其设计和产生阶段就主动实施长期保存方案,而这就会更多地牵涉机构内部及机构之间的利益以及利益相关者的角色变化。

可见,电子文件的长期保存涉及很多因素,需要采取各类方法和途径。一个普遍的共识是,数字信息长期保存最经济有效的办法是及早、主动地实施长期保存方案。电子文件长期保存越早开始越能节约成本,最好是在它们产生之初就主动实施覆盖其整个生命周期的长期保存计划。恢复或者再现已经丢失或无法读取的电子文件信息比一开始就实施对其的长期保存的成本要高出很多,更何况电子文件一旦丢失或无法读取,就很可能没有了再现和再造的机会。

人们在电子文件长期保存的活动中,存在一些常见的认识误区,例如,关于电子文件长期保存的期限问题,不少人对此并不清楚,有人悲观地认为只有数年,有人以为与纸质档案一样可达数个世纪。其实,电子文件难以持久存取,根据美国国家档案与文件署及国际公认的期限,电子文件保存50年以上即可认为是长期保存。

此外,Adrian Brown从一般的组织机构层面,对数字信息长期保存的认识误区进行了剖析,他在这个问题上独到的个人见解虽然可能存在偏颇,但能在很大程度上增强中小型组织机构对电子文件长期保存的信心和勇气。

误区之一,电子文件长期保存只有国家机构才能解决,小型机构对此无能为力。国家机构无疑能够引领电子文件长期保存的重要实践和原则,但是,根据已有的成熟经验、经济基础、实践工具和服务手段,对于任何类型和大小的机构而言,电子文件的长期保存不仅是现实可行的,而且势在必行。

误区之二,电子文件长期保存需要巨大的资金投入才能实施。人们很容易想到的一个典型案例是,美国国家档案与文件署为了长期保存联邦政府所产生的电子文件,投入3亿美元建设电子文件档案馆(ERA)。但这并不意味着不同规模和不同类型的机构都需要花费巨资才能实施其电子文件长期保存计划。比如,与ERA的巨资投入相比,英国考古学遗产中心(English Heritage Center for Archaeology)仅以数百英镑的成本投入就可以建设其数字保存库。当然,这需要合理规划,及充分利用已有的工具、资源和系统。

误区之三,电子文件长期保存需要高深的技术才能实施。技术领域无疑占据了数字信息长期保存的研究前沿,但是,数字保存实践并不要求十分高深的技术背景。在信息管理人才培养方案和培训计划中,数字保存作为重要的职业技能之一,已经成为人才培养和职业培训方案的重要内容。因此,来自档案馆、图书馆和IT行业的档案保管者具有很多不同渠道的学习和培训机会,对于他们而言,数字保存职业能力并不是难以获得或不可提升的。

误区之四,电子文件长期保存的时机还未成熟,是以后或未来的任务。如前所述,电子文件长期保存越早开始越能节约成本,越经济有效。如果等到电子文件载体老化或信息丢失、无法读出之时才考虑其长期保存问题就为时已晚了。Adrian Brown指出,对于一个组织机构而言,如果它们要实现巨大的利益,而且需要避免潜在的法律、财务、管理和声誉风险以及具有重大历史价值和经济价值的信息丢失,那么,电子文件的长期保存是迫切需要着手处理的问题。当然,这并不是指必须立即解决电子文件长期保存领域所有的问题或者与其他组织机构具有完全一样的数字保存需求。对于一个尚未实施电子文件长期保存的组织机构而言,现在就是开始实际行动的最好时机。[5]