数据库原理及应用教程(第4版)(微课版)
上QQ阅读APP看书,第一时间看更新

1.1 信息、数据、数据处理与数据管理

1.1.1 数据与信息

在数据处理中,最常用到的基本概念就是数据和信息,二者既有区别又有联系。

1.信息

(1)信息(Information)的定义。信息是人脑对现实世界事物的存在方式、运动状态以及事物之间联系的抽象反映。信息是客观存在的,人类有意识地对信息进行采集并加工、传递,从而形成了各种消息、情报、指令、数据及信号等。例如,对于学生基本情况来说,某同学的学号是“S1”,姓名是“赵亦”,性别是“女”,年龄是“17岁”,所在系别是“计算机”等,这些都是关于某个同学的具体信息,是该同学当前存在状态的反映。

(2)信息的特征。

①信息源于物质和能量。信息不可能脱离物质而存在,信息的传递需要物质载体,信息的获取和传递要消耗能量,如信息可以通过报纸、电台、电视和计算机网络进行传递。

②信息是可以感知的。人类对客观事物的感知,可以通过感觉器官,也可以通过各种仪器仪表和传感器,不同的信息源有不同的感知形式。如报纸上刊登的信息通过视觉器官感知,电台中广播的信息通过听觉器官感知。

③ 信息是可存储、加工、传递和再生的。人们用大脑存储信息,叫做记忆。计算机存储器、录音、录像等技术的发展,进一步扩大了信息存储的范围。借助计算机,还可对收集到的信息进行整理。

2.数据

(1)数据(Data)的定义。数据是由用来记录信息的可识别的符号组合的,是信息的具体表现形式。例如,上面提到的某个同学的信息,可用一组数据“S1、赵亦、女、17、计算机”表示。当给这些符号赋予特定语义后,它们就转换为可传递的信息。

可见,数据和它的语义是不可分割的。例如,对于数据:(赵亦,计算机),可以赋予它相关的语义,即学生“赵亦”属于“计算机”系。如果不了解其语义,则无法对数据进行正确解释,甚至解释为“赵亦”学习的课程为“计算机”。

(2)数据的表现形式。可用多种不同的数据形式表示同一信息,而信息不随数据形式的不同而改变。如“2000年硕士研究生将扩招30%”,其中的数据可改为汉字形式“两千年”“百分之三十”,而表达的信息是一致的。

由于早期的计算机系统主要用于科学计算,因此计算机中处理的数据主要是整数、浮点数等传统数学中的数字。但是,在现代计算机系统中,数据的概念已被大大地拓宽了,其表现形式不仅包括数字,还包括文字、图形、图像、声音和视频等,它们都可以经过数字化后存储到计算机中。

3.数据与信息的联系

通过前面的分析可以看出,信息与数据之间存在着固有的联系:数据是信息的符号表示,信息则是对数据的语义解释。如上例中的数据“2000”“30%”被赋予了特定的语义,此处的2000表示的是“2000年”,30%表示的是“研究生将扩招30%”,因此,它们就具有了传递信息的功能。可以用下式简单地表示信息与数据的关系:

信息=数据+语义

数据表示了信息,而信息只有通过数据形式表示出来才能被人们理解和接受。尽管两者在概念上不尽相同,但通常人们并不严格地区分它们。

1.1.2 数据处理与数据管理

数据处理是将数据转换成信息的过程,包括对数据的收集、管理、加工利用乃至信息输出等一系列活动。其目的之一是从大量的原始数据中抽取和推导出有价值的信息,作为决策的依据;目的之二是借助计算机科学地保存和管理大量复杂的数据,以便人们能够方便地充分利用这些信息资源。

在数据处理过程中,数据是原料,是输入;而信息是产出,是输出结果。“数据处理”的真正含义应该是为了产生信息而处理数据。

在数据处理中,数据管理过程比较复杂,主要包括数据的分类、组织、编码、存储、维护、检索等操作。对于这些数据管理的操作,应研制一个通用、高效而又使用方便的管理软件,把数据有效地管理起来,以便最大限度地减轻程序员管理数据的负担;至于处理业务中的加工计算,因不同业务而存在实现上的差异,要靠程序员根据实际业务情况编写相关应用程序加以解决。所以,数据管理是与数据处理相关的必不可少的环节,其技术的优劣将直接影响数据处理的效果。数据库技术正是瞄准这一目标而研究、发展并完善起来的。