第一章 电子文件长期保存的相关概念及理论基础
第一节 电子文件的概念、特点及类型
人们对电子文件(electronic records)一词的称呼和使用由机读档案(machine-readable archives)演变而来。20世纪50~60年代,随着计算机技术在军事和科技领域的应用,记录于计算机磁带上的一类新型档案——机读档案由此而产生。根据我们的文献调研,从20世纪60年代直至80年代中后期,欧美的政府机关及企业使用“机读档案”一词较多,“电子文件”的使用并不多见。80年代末90年代初,随着文件管理工作在现代计算机环境中的作用日益突出,“电子文件”一词开始流行,并逐步取代“机读档案”。
电子文件的产生有两种方式,一种是原生性的,直接产生于电子办公环境、电子政务、电子商务或者其他电子化业务活动及网络环境,另一种则是对传统介质档案做数字化处理以后形成的数字化副本。电子文件既具有文件的基本属性,又具有数字信息的特征。因此,从概念隶属关系来看,电子文件可以视为“文件”与“数字信息”这两个概念集合的交集。国际档案理事会对文件和电子文件的定义可为我们理解和全面认识电子文件提供有益的参考。国际档案理事会电子文件委员会《电子文件管理指南》(1997年)和在此基础上编制的《电子文件:档案工作者手册》(2005年)对文件的定义非常宽泛:“文件是由机构或个人在其活动的开始、进行和结束过程中产生或获得,由内容、背景和结构构成并足以证明该活动的信息记录”,该定义对文件这一“信息记录”并没有限制格式或者载体形式,适用于所有类型和载体形式。但是,该定义准确而清晰地指明了文件最基本的属性,即在文件形成主体的活动中产生并具有证明该活动的证据价值。电子文件是文件的种概念,其定义建立在文件的基础之上,根据《电子文件管理指南》,电子文件是“通过数字计算机进行操作、传递和处理的文件”。文件必须与某一组织或机构的活动相关,该活动或者事务是文件产生的来源,同时,文件又为该活动提供证据,电子文件也不例外。因此,所有的组织都应该收集和保管文件,既为满足组织自身业务活动的需要,也为法律取证的需要,文件产生和保存的主要目的是对组织的运作或对法人及个人活动的问责提供证明。
可以按照两种不同的标准对文件进行分类。一种是根据文件的功能来分类。即根据文件在不同的办公职能活动或事务中所发挥的功能对其进行分类,如:案卷卷宗、法院文件、人事文件、关系数据文件、网页文件等。另一种则是根据文件的格式和表现形式来分类。包括:字处理文件、数据库文件、超文本文件、图像文件、电子表格、电子邮件、语音邮件、视频,等等。
内容、结构和背景是构成文件的基本要素,从这三个构成要素来全面理解和认识电子文件尤为重要。文件的内容是指文件所要表达的事实或者信息,是文件的核心。文件的结构是指文件的记录组织方式,包括文件使用的符号、文件的组织布局、文件的格式、文件的载体等。对于电子文件而言,有物理结构和逻辑结构之分。与传统文件固定而直观的物理结构不同,电子文件的物理结构是可变的且依赖于硬件和软件,电子文件的逻辑结构是指其各个组成部分之间的关系,使得文件可理解。文件的背景包括如下三个要素:第一,文件所包含的背景信息,如文件执行者的签名;第二,文件与同一全宗内其他文件之间的关系;第三,形成文件的活动信息。背景信息使文件本身与产生该文件的行政管理(事务)活动或其他文件发生关联,其目的在于:为完整而充分地理解文件提供必要的信息;为完整而充分地理解与文件相关的活动或事务提供必要的信息;为文件的处置(鉴定、迁移、移交等)提供必要的信息;为有效地管理和长期保存文件提供必要的信息;为有效地检索和利用文件提供信息。背景信息同时也能为文件的真实性、可靠性和完整性提供保障,这对于电子文件十分重要。文件形成机构的业务活动、功能和文件管理系统是文件背景的构成部分之一。电子文件的背景信息可以通过其内部元素如附件、附加信息、链接、数字和参数代码等保存,也可通过外部元素如元数据进行保存。元数据是用于描述文件的背景、内容、结构及管理活动的数据。元数据对于电子文件非常重要,因为它建立了文件与其形成的职能活动和行政管理背景之间的联系。为了使电子文件可理解和可用,元数据几乎包括了所有类型的信息。元数据可用于不同的目的,如文件的检索、利用、真实性保障、可靠性保障、维护、保存和鉴定,等等。从文件形成和管理机构角度看,元数据可分为两种类型:提供业务活动背景信息的元数据和反映文件捕获及存储的管理元数据。
国际档案理事会关于文件定义、文件特质及文件构成的指南性意见对于我们准确认识电子文件的本质特征和构成要素具有积极的参考作用。此外,美国国家档案与文件署认为,电子文件是以计算机可处理的形式存储的文件。澳大利亚国家档案馆认为,电子文件是由计算机交流与维护的文件。而加拿大InterPARES项目组认为,电子文件是以电子形式形成(制作、接收及为今后的活动和参考而保留下来)的文件。
我国国家标准《电子文件归档与管理规范》规定,电子文件是指在数字设备及环境中生成,以数码形式存储于磁带、磁盘、光盘等载体,依赖计算机等数字设备阅读、处理,并可在通信网络上传送的文件。此外,《电子文件管理暂行办法》(中办国办厅字〔2009〕39号)规定,本办法所称电子文件,是指机关、团体、企事业单位和其他组织在处理公务过程中,通过计算机等电子设备形成、办理、传输和存储的文字、图表、图像、音频、视频等不同形式的信息记录。
为了支持组织的业务活动及提供证据,根据ISO 15489-1和《电子文件:档案工作者手册》,文件必须具备如下四个特质:
第一,真实性。指文件的内容、背景和结构能长久保持其产生时的原貌。一份真实的文件应符合如下条件:文件与其制作的目的相符;文件的形成和发送与其既定的形成者和发送者相吻合;文件的形成或发送与其既定的时间一致。为了确保文件的真实性,机构应执行并记录文件管理方针和政策,便于控制文件的形成、接收、传递、保管和处置,从而确保文件形成者是经过授权和确认的,同时,能够防止未经授权对文件进行增、删、改、利用和隐藏。
第二,可靠性。文件能够被作为可信的证据,强调文件作为证据的权威性和可信性。文件的内容可信,可以充分准确地反映其所证明的事务、活动或事实,为后续的业务或活动提供依据。
第三,完整性。文件是完整的且未经改动的。应防止文件未经授权而改动。在文件管理方针和程序中应明确:文件形成之后可对文件进行添加或注释;在何种条件下、授权谁来负责添加或注释;任何授权的注释、添加及删除都应明确注明并可跟踪。
第四,可用性。文件能够被定位、检索、呈现及理解。可用的文件应该能够直接表明文件与产生它的业务活动和事务过程。文件之间的背景联系中应该包含有助于理解文件形成及利用事务的信息,这些信息能够在更为广泛的业务活动背景和功能中确认该文件。文件之间的背景联系记录了活动的顺序而应该被保存。
具备了上述特征的文件将有充实的内容、结构和背景信息为相关的活动和事务提供完整的证明,从而反映组织机构的决策、行动和责任。如果这样的文件以易于存取、可读和可用的方式保存,它们将支持业务需求,并能长久用于问责的目的。
电子文件除了具有文件的四个基本特质之外,还同时具有数字信息的共性:由电子计算机等数字设备生成和处理,信息用二进制数字代码记录和表示。其基本特点包括:数字信息对载体及环境的依赖性、数字信息内容的非人工识读性、数字信息可在不同载体间的转换性、数字信息可在信息网络中的流动性、数字信息的不稳定性,等等。
电子文件类型多样,按照电子文件的格式对电子文件进行分类最为常见,可分为如下几种:
(1)文本电子文件。通过文字处理技术形成,以XML、RTF、TXT、PDF为通用格式。
(2)图像电子文件。通过扫描仪等设备获得,以JPEG、TIFF为通用格式。
(3)图形电子文件。通过计算机辅助设计或绘图等软件获得。
(4)音频电子文件。通过数字音频设备获得,以WAV、MP3为通用格式。
(5)视频及多媒体电子文件。用数字视频技术、多媒体技术设备以及超媒体链接技术制作形成,以MPEG、AVI为通用格式。
(6)数据库电子文件。是以数据库形式组织存储的具有文件属性的信息记录。在数据库中有很多条记录,数据库文件可以是其中的某一条记录,也可以是若干相关的记录集合。不同的数据库管理软件形成的数据库电子文件具有不同的格式。
(7)计算机程序文件。是用计算机语言编写的程序,是一种计算机软件,包括软件型号、名称、版本号和相关参数手册、说明资料等。计算机程序文件分为通用软件程序文件和专用软件程序文件。对于专用软件产生的电子文件,原则上一般应转换成通用型电子文件。如果难以转换,则必须将该专用软件一并收集。
另外,按照电子文件的功能,还可将电子文件分为主文件、支持性文件、工具性文件;按照电子文件的组成方式,可分为简单文件、复杂文件(如多媒体文件、超文本文件、超媒体文件等);按照电子文件的存储介质,可分为磁带文件、磁盘文件、光盘文件。