电子文件长期保存:理论与实践
上QQ阅读APP看书,第一时间看更新

第四节 电子文件长期保存的理论基础

文件生命周期理论、文件连续体理论、前端控制思想及全程管理原则奠定了电子文件长期保存的理论基础。

一 文件生命周期理论(Life Cycle Theory of Records)

文件生命周期理论是文件管理的核心理论,它揭示了文件运动的过程和基本规律,不仅适用于传统纸质文件的管理,而且对包括电子文件在内的特殊载体文件管理也具有一定的指导意义。20世纪中期,文件中心的出现以及人们对其的理论探索是文件生命周期理论产生的直接原因。此后,人们对文件的运动过程以及针对文件运动过程的全面管理进行了系统研究,最终在不断的理论探索和研究中形成了文件生命周期理论。

文件生命周期理论认为,文件具有一定的生命周期,现行文件从其产生到最终销毁或永久保存是一个完整的生命运动过程。这一运动过程由于文件价值形态的变化,可以划分为若干阶段。文件在每一阶段因价值形态的不同,保存场所、管理方式及服务对象也不相同。文件的价值形态与其保存场所、管理方式及服务对象之间存在一定的对应关系。具体见表1-1。

表1-1 文件生命周期阶段表

第一,文件从其形成到销毁或永久保存,是一个完整的生命运动过程。文件的形成、流转,办理完毕、归档保存或销毁,最终移交档案馆永久保存的过程是一个前后相继、连续统一的生命运动过程。

第二,由于文件价值形态的变化,这一生命过程可划分为若干阶段。文件的生命运动具有阶段性,一般将文件生命运动阶段划分为现行、半现行和非现行三个阶段。

第三,文件在每一个阶段因具有不同的价值形态,而具有不同的服务对象、保存场所和管理方式。

现行阶段的文件具有现行效用,处于机关文件的流转过程中,文件办理完毕后,需要根据其价值大小决定是否归档保存或销毁。归档保存的文件进入半现行阶段,这一阶段的文件对本机关具有一定参考作用,保存在机关档案室或文件中心,主要为本机关服务,具有过渡性。文件在机关档案室或文件中心临时保存若干时期,经过鉴定之后可将其中具有永久保存价值的文件移交档案馆,此时,文件进入非现行阶段,非现行阶段的文件对形成机关已经丧失了最初的原始价值,而主要体现为对整个社会的历史文化价值、情报价值等。

文件在现行、半现行和非现行阶段的生命运动过程中,对本机关的原始价值(行政、财务、法律等价值)和对本机关之外的其他利用者的档案价值出现了此消彼长的变化。在现行阶段,文件主要发挥对机关的现行效用,在机关部门间流转,直到办理完毕,文件主要体现为原始价值;在半现行阶段,部分文件最初仍然具有较高的原始价值,但随着时间的推移,原始价值逐渐衰减,少部分文件的档案价值开始逐渐显现;在非现行阶段,文件的原始价值丧失,少部分文件的档案价值突出,移交档案馆,为社会各界服务。随着文件原始价值的消减和档案价值的增强,文件的保管场所也发生了变化,从机关内部到档案室(文件中心),最终只有极少部分具有长久保存价值的文件移交到档案馆。在文件价值形态演变的过程中,文件的服务对象也逐渐由内向外,同时,服务方式经历了一个从封闭到开放的过程。

二 文件连续体理论(Theory of Records Continuum)

1.文件连续体理论的产生及理论模型、基本原则

电子文件也存在生命运动周期。但是电子文件的生命运动特点与传统文件有所不同。传统文件的生命运动阶段大多是顺序向前的,由一个阶段转入下一个阶段,但电子文件在特殊情况下可能会做逆向运动。传统文件运动阶段之间的界限分明,容易划分,而电子文件往往可能同时处于不同的运动阶段,难以划分各阶段的界限。而且,传统文件在各阶段的价值形态与保管场所、服务对象等相关因素的对应关系对于电子文件不是非常适用。由于电子文件对技术、设备和系统的依赖性,以及信息内容与载体的可分离性,其价值形态可能无法与保管场所绝对对应。

文件连续体的理论依据是社会学领域的结构主义思想。根据澳大利亚国家标准AS4390的规定,“文件连续体是从文件形成(包括形成之前的文件管理系统设计之初)一直到其被作为档案永久保存的一个连续、一致的管理过程”。[11]

澳大利亚档案学者Ian Maclean、Sue McKemmish、Frank Upward等人在文件连续体理论的产生和发展中做出了重要贡献。该理论最初由澳大利亚著名档案学者、国家档案馆首任馆长Ian Maclean在20世纪50年代提出,基本形成于20世纪80年代。20世纪90年代,澳大利亚档案学者Frank Upward以英国著名社会学家Anthony Giddens对结构主义理论的阐述和评价为理论基础,重新阐释和进一步发展了文件连续体管理模式,为该理论思想的发展做出了重要的贡献。

Ian Maclean于20世纪50年代最早提出了文件连续体管理思想,他认为档案工作者应该将其职能活动建立在对记录的特征、记录的保管体系及分类方法进行研究的基础之上,在一定的时间和空间维度,对记录进行整理、分类和排序。此后澳大利亚档案学者Sue McKemmish重申了他的这一观点。[12]1983年华盛顿大学教授Richard Berner针对文件连续运动的特点,强调了文件管理人员和档案工作者在文件处置(销毁、长期保存和利用)中的持续合作与互动关系。他认为,文件管理和档案管理职业虽然有所不同,但二者有一个共同的目标:即从文件形成到长久保存的各个连续阶段都实施对文件信息的有效管理。应通过对文件生命各个连续阶段的有效管理,确保以正确的格式创建正确的文件,含有正确的信息;对文件进行组织并分析其内容,以提高其可用性;确保对拥有利用权限和利用需求的管理人员和研究人员等及时提供文件利用;系统地处置那些不再需要保存的文件;妥善保管并长期保存需要永久保存的文件。[13]

20世纪90年代 Frank Upward进一步发展了“文件连续体”的理论思想和理论体系,其核心在于强调文件生命运动的时空整体性和非间断性,通过对文件形成流转背景的分析,将文件的保管形式与对应的业务活动和业务环境联系在一起。他构造了一个多维坐标模型,对文件的运动过程进行了立体描述。这一模型包括四个坐标轴——文件保管轴、证据轴、业务活动(事务处理)轴和形成者(身份)轴(见图1-1)。其中,文件保管形式轴是核心,它的变化带动了其他坐标轴的相应变化。文件保管的形式决定了文件的其他要素,在文件保管形式轴上,随着文件保管形式由单份文件到案卷、全宗、全宗集合的变化,其形成者、业务活动和价值也发生了相应的变化。文件连续体理论的四“维”——“文件的形成”、“文件的捕获”、“文件的组织”和“文件的聚合”则以时间为基础,体现了文件保管各个要素的联合和互动。Frank Upward所提出的文件运动模型,使我们能更为清楚地看到和意识到文件与档案是一体的,揭示了文件管理者和档案工作者之间持续而密切的关系,从时空维度描述了文件的过去、现在和未来之间的关系,对于建立文件管理者和档案管理者之间的协同关系及其与其他利益相关者之间的战略合作关系具有重要的理论指导意义。

图1-1 文件连续体模式坐标图

资料来源:傅荣校、王相华著《理论核心问题:原则与内容——文件生命周期理论与文件连续体理论比较研究之二》,《档案学通讯》2004年第4期。

根据Frank Upward的主张,文件连续体理论具有如下四个基本原则:(1)文件的概念延伸至档案。文件价值包括其从属价值(档案价值),这样有利于强化它们对事务处理、提供证据和实现记忆目的的作用,并统一归档保存的方法。这与我国档案界所理解的“大文件”概念是一致的。(2)无论是纸质文件还是电子文件,文件应该是逻辑实体而不是物理实体。(3)文件保管应该融入企业和社会的活动过程及目的。(4)档案学提供了文件保管与组织的知识基础。这种知识是可更新的、结构化的,而且可以深入应用至过去、现在和未来。Frank Upward所提出的上述理论原则实质上强调了两个方面:第一,文件与档案在概念、价值、管理方法和利用目的等方面存在连续性和一致性,第二,文件管理活动应该与业务活动和社会活动集成和融合。[14][15]

2010年以来Frank Upward等学者拓展深化了网络环境下文件连续体理论的适用范围。2013年Frank Upward等在新旧文件保管方法及文件连续体理论的基础上提出了一个新的学科领域——文件保存信息学,旨在重塑文件管理的思想、体系、流程和实践,以应对网络环境下日益增长的信息融合、混乱和复杂性。其中,连续体思想和文件保管元数据是文件保存信息学的两大支柱。同时,这一理论涉及三个方面的研究内容:组织文化分析、业务流程分析和文件存取利用分析。该理论认为,信息和通信技术的应用进一步打破了文件保存内部过程的连贯性,因此,目前急需制定一种框架来识别和解决这个问题,这一框架产生于而且依赖于社会形态、文件保存过程和档案馆之间强烈的共生关系,这样才能适应日益增长的组织和社区环境的多元化趋势。[16]

文件连续体理论的创新之处在于:(1)研究视角独特。它从逻辑上将文件与档案视为一个整体,强调的是文件保管形式的变化对文件其他要素的影响,描述了文件从最小的保管单位到最大保管单位的运动过程和规律性。(2)研究方法新颖。采用一个多维坐标模型来描述文件的运动过程,将文件运动纳入一个立体、多元的环境之中,考察文件保管形式与价值形态、业务活动及形成者之间的互动关系。(3)研究的基础在于将文件运动视为一个连续的过程,强化了文件和档案管理的一致性、关联性和文件管理的全过程性,充分体现了电子文件运动的特点。(4)注重文件的形成过程及背景。较为生动地描述了文件活动的主体、保管形态及凭证价值与不同层次(由内及外)业务活动之间的对应关系。

文件生命周期理论与文件连续体理论之间的关系问题曾经引起了人们的热议。文件生命周期理论对于传统档案管理的理论指导意义是不言而喻的,它从理论上科学地阐释了文件中心存在的合理性,奠定了文件的分阶段管理以及全过程管理的理论基础。对于电子文件管理而言,文件生命周期理论虽然在一些细节问题上难以得到完美的解释,但仍然具有宏观上的理论指导价值。这是因为,无论文件的载体形态如何,文件生命周期理论都是对文件运动普遍规律的客观描述。电子文件是文件的一种,具有文件的基本属性,它在载体形式和生成环境方面虽然具有特殊性,但仍然要历经从产生到销毁或永久保存的整个生命周期。电子文件的运动仍然具有一定的阶段性,只不过各阶段的界限模糊,运动特点发生了变化,此外,电子文件的价值形态与相关因素的对应关系虽然已经弱化,但并不是绝对消失。

对于电子文件而言,文件的形成过程和背景尤为重要。文件连续体的理论基础不同于文件生命周期理论,它是源于结构主义原则从时间和空间维度对文件生命运动所做的理论解释,二者具有不同的理论视角。它所强调的文件和档案在价值及管理上的连续性特点,以及建立文件管理者与档案工作者及其他利益相关者的合作战略,对电子文件管理具有积极的指导意义。

2.文件连续体理论与电子文件的集成管理原则

文件连续体理论是对文件从其最初产生到长期保存的连续运动过程的时空描述:在业务(事务)活动的驱动下,业务(事务)部门产生了单份文件,将若干关联的单份文件组合成文件单元(案卷),在文件单元基础上形成全宗(机构记忆),最终汇集成全宗集合(集体记忆)。在该过程中,文件所对应的事务大小、主体身份、保管场所及价值形态发生了变化。这一运动变化过程是与特定的业务活动和社会活动紧密融合在一起的,文件管理者与档案管理者的工作对象和内容也存在连续性和一致性特点。因此,应该加强文件管理者与档案工作者之间的工作协同,并加强与其他利益相关者的密切合作,将文件管理活动融合到组织机构的业务管理活动中。电子文件的集成管理原则正是在这一理论原则和思想的基础上产生的。所谓集成管理,是将与电子文件生成、运行、保管等管理活动有关的要素进行互联,综合管理,统筹规划。集成管理不仅关注文件的流转过程,也关注与文件流相伴而生的业务流,关注其他信息流的统筹兼顾,体现了系统化和集约化管理思想。电子文件的集成管理主要包括以下四个方面的内容:第一,文件流与业务流的集成,文件管理活动融入组织机构的业务管理活动。文件流与业务流的结合程度是衡量电子文件管理质量的一个重要标准。电子文件管理系统应支持本机构的文件运转流程和业务流程,在确保文件真实、完整、可靠、可用的同时,保证文件运转和业务流程的高效运行。第二,文件流与其他信息流的集成,文件管理活动融入组织机构的信息管理活动。文件是构成组织机构信息资源的一种类型,机构在工作中还会接收、运行、保管和利用各种非文件信息,要确保文件流与其他信息流的集成,即令电子文件管理系统接入组织机构的信息管理系统。第三,文件内部管理活动的集成。为了优化电子文件管理、提高机构工作效率,电子文件管理的各项业务工作应该根据其内在连续性、关联性和一致性而进行整合或集成,如文件归档与鉴定和著录等业务工作的结合等。第四,文件管理与档案管理的协作和集成。即文件管理工作与档案管理工作的协同合作,加强管理程序、管理标准、管理原则的连续性、一致性和协调性。

三 前端控制思想

前端控制思想强调在整个文件生命周期中,将档案工作提前到初期阶段,而不是在文件运转完毕后的归档阶段才开始实施档案化管理。国外档案界主张对电子文件生命运动进行提前干预和控制,“前端控制”这一特定术语实际上是国内档案界对该思想的借鉴和理论总结。法国档案学者诺加雷所主张的“档案工作者要重新考虑他们在文件生命周期中进行干预的时机,甚至重新思考这种生命周期本身”的观点被认为是前端控制思想产生的根源。[17]另外,国际档案理事会电子文件委员会在其编制的《电子文件管理指南》中着重阐述了重新考虑电子文件生命周期及干预的时机问题,并将提前干预的时机确定为电子文件管理系统的设计阶段,主张在“在文件形成前采取行动”。这意味着许多在纸质档案管理中的后控制手段(如归档、鉴定、著录等)都会提前。[18]如前所述,RLG的归档信息工作组在广泛调查的基础上。于1996年发布了《数字信息归档报告》。该报告明确提出“应尽早采取电子文件长期保存行动,最好是在它们产生之初就主动实施覆盖整个生命周期的长期保存计划。恢复或者再现已经丢失或无法读取的电子文件信息比一开始就实施对其的长期保存的成本要高出很多”的建议。可见,20世纪90年代中期,电子文件(数字信息)的前端控制策略在国外电子文件(数字信息)的长期保存实践中开始得到了认同。

在传统的文档管理中,文件归档之后才由档案部门进行管理和控制,文件在最初形成和流转阶段的工作都由文书或业务部门处理,档案部门一般不加控制,档案部门对文件进行处置和保管一般是在文件归档之后才开始。而电子文件产生于数字环境,它对载体的依赖性、易操作性、与载体可分离性等特点使其极易丢失和修改。如果不从电子文件形成之初就实施档案化控制,电子文件的真实性、完整性、可靠性和可用性极难得到保障。我们将无法确认归档时的文件是否真实、完整、可靠,也就无法将其作为档案进行长久保存,电子文件应有的证据价值将无法确认和实现。因此,档案人员从电子文件的生命之初即从电子文件管理系统的设计阶段就积极介入,例如将文件管理元数据方案嵌入系统设计,实施覆盖其整个生命周期的档案化控制,才有可能保障电子文件的真实性、完整性、可靠性和可用性。

根据前端控制思想,一些在纸质档案文件管理程序中的重要工作环节和内容必须提前,甚至延伸至系统设计阶段。在电子文件管理系统的设计阶段,要求从档案化的角度分析电子文件管理系统的功能需求,引导其设计与开发,并且通过元数据方案实现对电子文件的前端控制。在设计电子文件管理系统时,不仅要考虑电子文件在执行机构业务活动中的高效流转,还要关注对电子文件真实性、完整性、可靠性和可用性的保障,例如可考虑嵌入元数据捕获功能,以便在电子文件的形成之初就开始动态跟踪,描述其从产生、流转至文件归档及长期保存或销毁、提供利用等整个生命运动过程中的各类相关信息,如文件处置过程信息、文件结构信息、不断增加或变化的背景信息、文件内容信息等等。这些信息能够确保文件的真实性、完整性和可靠性,从而保证电子文件自形成起完整无缺、来源可靠、未被非法更改。

除此之外,电子文件的归档、描述、著录和鉴定等环节也提前了。与纸质档案的定期归档(第二年上半年)不同,电子文件应在办理完毕之后实时归档,赋予其归档标记,纳入档案系统并对其进行监控和管理,防止电子文件丢失或被非法更改,以保证电子文件的真实性和完整性。电子文件的描述与著录与纸质档案著录在性质、内容及时机方面也有明显不同,电子文件的描述和著录随着电子文件的产生就开始,覆盖了电子文件的整个生命运动过程:流转、传递、处置、鉴定、归档存储和利用,实施长期保存策略如迁移、更新等全过程。因为电子文件的描述和著录不仅要揭示电子文件的内容特征和形式特征,还要动态反映电子文件的运动过程和背景信息,是确保电子文件真实性、完整性、可靠性和可用性的重要手段。电子文件的鉴定在电子文件形成阶段就应该开始,在电子文件的采集、保管以及对电子文件实施迁移、更新或转换策略之前都要进行鉴定。

四 全程管理原则

电子文件全程管理原则实质是对电子文件全生命周期的过程管理,强调从电子文件管理系统的设计之初开始,对电子文件形成、办理、传输、保存、利用、销毁等实行全程管理,确保电子文件始终处于受控状态,将电子文件的形成、运转、维护、长期保存等各个阶段的工作内容有机结合在一起,前后衔接、浑然一体,通过对电子文件全生命周期的控制来确保电子文件的真实性、完整性、可靠性和可用性。可见,全程管理原则与文档一体化管理原则是一致的,都是从电子文件生命运动的连续性和无间断性的规律出发,全程、动态地跟踪和控制电子文件的生命运动。全程管理原则与文件生命周期理论、文件连续体理论之间都存在渊源,与前端控制思想相互呼应,体现了对电子文件从生命之初到生命之终(或永久保存)的全过程管理思想,其目的也是为了保证电子文件的真实性、完整性、可靠性和可用性。

电子文件全程管理要求从整体上对管理过程、管理需求等进行梳理、分析和整合。首先,体现在文件管理流程与业务流程的集成上。电子文件是对电子化业务的原始记录,因此,电子文件的管理流程必须与业务流程集成、融合。电子文件管理系统应密切结合相应的电子化业务管理需求,提高文件运转和处置的效率。文档管理部门、业务部门、计算机技术部门或信息部门在文件的形成、处置、维护等过程中协同工作,承担保护电子文件真实性、完整性、可靠性和可用性的职责。其次,体现在对电子文件管理环节的重组上。电子文件虽然与纸质文件一样,也要经历形成、办理、传输、保存、利用、销毁等基本的管理过程,但是在具体管理环节的先后顺序及管理方式等方面已经发生了很大的变化。如前所述:电子文件的鉴定、归档、著录等提前到文件设计和形成阶段;著录贯穿于电子文件整个生命周期;而在每一次对电子文件采取迁移或更新等策略之前都需要对其进行鉴定;电子文件的登记、归档及著录等工作可以由系统自动执行,总体上呈现出非线性、并行性和集成化的特点。[19]再次,体现在对电子文件运动前后端格式的一体化上。从管理流程来看,电子文件前后端格式关系密切,甚至有相互转化的需求。电子文件办理完毕以后需要采用不可编辑的归档格式进行保存,而归档文件在利用时有可能需要采用能够被编辑的格式。只有将归档和提供利用这两种业务置于统一的格式规范体系下,才能实现前后端格式的转化。从管理要求上看,为了确保电子文件在其全生命运动过程中的真实性、完整性、可靠性和可用性,应尽可能减少同质变换的环节,在全过程管理中采用统一的保密和认证等技术保障手段,这样既可以节约成本,也有利于实现目标。从技术条件上看,电子文件前后端格式一体化具有较为充分的技术条件,例如,Adobe在其PDF文件中可以实现重排。为了实现电子文件文档格式的一体化,根据目前已有的电子文件管理标准,可以进一步采取如下措施:第一,电子文件前端格式选择标文通(UOF)格式,后端即电子档案阶段在标文通格式基础上进行扩展,选择相应的版式文档格式,实现流式文档与版式文档格式的一体化;第二,共用加密或数字签名等技术,以最小的成本确保电子文件的真实性、完整性;第三,对电子文件前后端公共数据对象采用统一的描述标准,提高电子文件格式的透明性和可理解性。最后,体现在电子文件前后端管理软件功能的集成上。如可以建立共性办公应用软件系统,主要包括电子文件办公业务系统、电子档案管理系统、电子文件发布利用系统。这三个系统覆盖了电子文件形成、流转、归档、移交、档案保管、提供利用、销毁等各个过程的共性业务,具有模块化的特点,适用于各类机构。[20]


[1] http://unesdoc.unesco.org/images/0013/001300/130071e.pdf.

[2] http://www.jisc.ac.uk/media/documents/programmes/preservation/jiscpolicy_p1finalreport.pdf.

[3] http://www.naa.gov.au/about-us/organisation/accountability/operations-and-preservation/digital-preservation-policy.aspx#section2.

[4] National Archives of Australia. An Approach to the Preservation of Digital Records. http://www.naa.gov.au/Images/An-approach-Green-Paper_tcm16-47161.pdf.

[5] Brown Adrian. Practical Digital Preservation:A How-to Guide for Organizations of Any Size(London:Facet Publishing,2013),5-6.

[6] Garrett John,Waters Donald,Preserving Digital Information:Report of the Task Force on Archiving of Digital Information Commissioned by the Commission on Preservation and Access and the Research Libraries Group.(Washington,D.C.:Commission on Preservation and Access,1996).

[7] OCLC/RLG PREMIS Working Group,Implementing Preservation Strategies for Digital Material:Current Practice and Emerging Trends in the Cultural Heritage Community(Dublin,OH:OCLC),2004.

[8] Li Yuan,Banach Meghan,Institutional Repositories and Digital Preservation:Assessing Current Practices at Research Libraries,D-Lib Magazine,2011,17(5/6),http://www.dlib.org/dlib/may11/yuanli/05yuanli.print.html.

[9] Boyle Frances,Eveleigh Alexandra,Needham Heather,Preserving Local Archival Heritage for Ongoing Accessibility [EB/OL]. [2013-08-12]. http://www.ariadne.ac.uk/issue58/boyle-et-al.

[10] 刘家真:《我国数字资源保存状况调查》,《中国图书馆学报》2006年第5期。

[11] Standards Australia,Australian Standard 4390,Records Management(Homebush,New South Wales:Standards Australia,1996).

[12] Upward Frank,In Search of the Continuum:Ian Maclean’s “Australian Experience” Essays on Recordkeeping,The Records Continuum:Ian Maclean and Australian Archives First Fifty Years,eds. S. McKemmish,M. Piggot(Canberra:Ancora Press in association with Australian Archives,1994),110-130.

[13] Berner Richard C. Archival Theory and Practice in the United States:A Historical Analysis(Seattle:University of Washington Press,1983),160-163.

[14] Upward Frank,Structuring the Records Continuum,Part One:Postcustodial Principles and Properties,Archives and Manuscripts, 24(2)(1996):268-285.

[15] Upward Frank,Structuring the Records Continuum,Part Two:Structuration Theory and Recordkeeping,Archives and Manuscripts, 25(1)1997:10-35.

[16] Upward Frank,Reed Barbara,Oliver Gillian,Evans Joanne,Recordkeeping Informatics:Re-figuring a Discipline in Crisis with a Single Minded Approach,Records Management Journal,23(1)2013:37-50.

[17] 〔法〕 C.诺加雷:《信息技术对档案与档案工作的影响》,郁宗成译,《第十三届国际档案大会文件报告集》,1996,第149页。

[18] 国际档案理事会电子文件委员会:《电子文件管理指南》,国家档案局科研所编译,中国档案出版社,1996,第105页。

[19] 刘越男:《电子文件全程管理——对纸张文档一体化管理的集成和发展》,《浙江档案》2006年第3期。

[20] 刘晓光:《电子文件全程管理业务需求及相关技术的研究》,《档案学研究》2010年第5期。