1.1 多媒体的基本概念
1.1.1 媒体与多媒体
1.媒体
我们通常所说的“媒体”包括两点含义:一是指信息的物理载体(即存储和传递信息的实体),如书本、挂图、磁盘、光盘以及相关的播放设备等;另一层含义是指信息的表现形式(或者说传播形式),如文字、声音、图像、动画等。多媒体计算机中所说的媒体,是指后者而言,即计算机不仅能处理文字、数值之类的信息,而且还能处理声音、图形、图像等各种不同形式的信息。
传统的媒体,如报纸、杂志、广播、电影和电视等,都是以各自的媒体形式进行传播。随着科学技术的发展,逐渐衍生出新的媒体,例如:IPTV、电子杂志等,它们在传统媒体的基础上发展起来,但与传统媒体又有着本质的区别。
国际电话电报咨询委员会CCITT(Consultative Committee on International Telephone and Telegraph,国际电信联盟ITU的一个分会)把媒体分成5类。
(1)感觉媒体(Perception Medium)。指直接作用于人的感觉器官,使人产生直接感觉的媒体。如引起听觉反应的声音,引起视觉反应的图像等。
(2)表示媒体(Representation Medium)。指传输感觉媒体的中介媒体,即用于数据交换的编码。如图像编码(JPEG、MPEG等)、文本编码(ASCII码、GB2312等)和声音编码等。
(3)表现媒体(Presentation Medium)。指进行信息输入和输出的媒体。如键盘、鼠标、扫描仪、话筒、摄像机等为输入媒体;显示器、打印机、喇叭等为输出媒体。
(4)存储媒体(Storage Medium)。指用于存储表示媒体的物理介质。如硬盘、光盘、可移动磁盘等。
(5)传输媒体(Transmission Medium)。指传输表示媒体的物理介质。如网线、电缆、光纤等。
2.多媒体
通常,人们所指的多媒体就是表示媒体,表示媒体就是信息的表示方法。信息本身是无形的,如果要使信息能被人理解和接受,必须将信息通过一定的方法表示出来。在没有经过表示媒体的“表现”之前,表示媒体并不能让你获得任何信息。通俗地讲,多媒体就是文本、音频、图形、图像、动画和视频等媒体信息。
那么多媒体的含义什么?多媒体是指能够同时获取、处理、编辑、存储和展示两种以上不同类型信息媒体的技术,这些信息媒体包括文字、声音、图形、图像、动画、视频等。从这个意义中可以看到,“多媒体”最终被归结为是一种“技术”。因此,“多媒体”实际上常常被当作“多媒体技术”的同义语。
另外,现在的多媒体技术往往与计算机联系起来,这是由于计算机的数字化及交互式处理能力极大地推动了多媒体技术的发展。通常可以把多媒体看作是先进的计算机技术与视频、音频和通信等技术融为一体而形成的新技术或新产品。因此,多媒体计算机技术的定义是计算机综合处理多种媒体信息,使多种信息(如文本、图形、图像、音频和视频)建立逻辑连接,集成为一个具有交互性的系统。简单地说,就是计算机综合处理声音、文字、图像等信息并使它们具有集成性和交互性。
多媒体技术综合了多种学科和信息科学领域的技术成果,它的研究涉及到计算机软、硬件系统、数字信号处理、高速通信网络、图像语音处理甚至文学艺术创作等诸多方面,多媒体技术是一门对多种媒体进行采集、编码、存储、传输、处理和表现并使之建立逻辑连接,集成为一个具有良好交互性系统的技术。多媒体技术与Internet技术一起成为推动现代信息化社会发展的两个最重要的动力,多媒体技术的产生和发展,正是现代社会信息化发展的必然。
1.1.2 多媒体的关键特性
根据前面对多媒体技术的定义,我们可以知道多媒体技术是计算机综合处理声音、文字、图形、影像视频信息的技术,综合性表现为以下几个特性,即多样性、交互性、集成性、实时性和高质性,这是它区别于传统计算机系统的特征,下面分别介绍这些特性。
1.多样性
多样性指两个方面,一方面指信息媒体的多样性,人类对于信息的接收和产生主要在5个感觉空间内,即视觉、听觉、触觉、嗅觉和味觉,其中前三者占了95%以上的信息量,借助于这些多感觉形式的信息交流,使人类对于信息的处理可以说是达到了得心应手的地步。虽然多媒体技术扩展了计算机所能处理的信息空间,处理的信息不再局限于文字与数字,还可以广泛采用图像、图形、视频,音频等其他信息。但是,计算机多媒体技术和设备缺乏类似于人类的眼睛、耳朵等感官所得到的视觉、听觉以及触觉、嗅觉、味觉的能力,无法从现实世界中自由地收集信息和表达各种信息,远远没有达到人类处理信息能力的水平,计算机只能按照单一的数字化形态加工处理和理解信息,并且在处理人类信息的过程中会产生一些变形和失真,使得人机交互系统在信息交流中产生一道屏障。人类如果要借助于计算机多媒体技术,就必须要忍受交互过程中信息的转换和变形,所以说,计算机在无失真处理和再现信息的能力方面还有待于提高。
另一方面是指多媒体计算机在处理输入的信息时,不仅仅是简单获取和再现信息,如声像信号的输入与输出,若二者完全一样,那只能称之为记录和重放,从效果上来说并不是很好。如果能根据人的构思、创意,对信息进行变换、组合和加工来处理文字、图形及动画等媒体,就可以不再局限于顺序、单调和狭小的范围,大大丰富和增强了信息的表现力,具有更充分更自由发展的空间,达到更生动、更活泼、更自然的效果。这些创作与综合不仅仅局限在对信息数据处理方面,也包括对设备、系统、网络等多种要素的重组和综合。其目的是能够更好地组织信息、处理信息和表现信息,从而使用户更全面、更准确地接受信息。多媒体技术为人性化处理信息的多样性提供强有力的手段,多媒体计算机成了处理信息多样性的重要设备。
2.交互性
所谓交互就是通过各种媒体信息,使参与的各方都可以进行编辑、控制和传递。长久以来,人们在很多情况下已经习惯于被动地接收信息,例如看电视、听广播,没有交互能力。多媒体系统将向用户提供交互式使用、编辑和控制信息的手段,为多媒体应用开辟更加广阔的领域,也为用户提供更加自然的信息存取手段。借助于交互活动,我们可以获得自己所关心的内容,获取更多的信息;对某些事物的运动过程进行控制可以获得某种奇特的效果,例如倒放、慢放、快放、变形、虚拟等处理多媒体信息,从而激发人们的想象力、创造力,提出各种讨论的主题。在媒体的信息检索应用中,用户也可以找出想读的书籍、想看的电视节目,可以快速跳过不感兴趣的部分,还可以对其中所关心的内容进行编排,需要时加上各种文字说明及配上各种不同的语言解说,但以上这些只是多媒体的初级交互应用。当人们完全进入一个与信息环境一体化的虚拟信息世界自由邀游时,全方位的交互将使得人们能够体验到逼真的感觉,这才是交互式应用的高级阶段,这种技术称为虚拟现实技术,但这种技术非常复杂,还有待于进一步研究和发展。
3.集成性
集成性是指多种媒体和设备的有机集成。多媒体系统的集成性主要表现在两方面,一方面是指多媒体信息媒体本身的集成,以往多媒体中的许多技术都可以单独使用,但作用却十分有限。这是因为它们是单一、零散的,比如单一的图像处理技术、声音处理技术、交互技术、电视技术、通信技术等;还有信息空间的不完整,例如仅有静态图像而无动态视频,仅有语音而无图像等,都将限制信息空间的信息组织,限制信息的有效使用。集成性将多种不同的媒体信息有机地进行同步组合成为一个完整的多媒体信息。这种集成包括信息的多通道统一获取,多媒体信息的统一存储与组织,以及多媒体信息表现合成等各方面。
另一方面是指把多媒体系统的各种设备与设施合成为一个整体,以往信息交互手段的单调性、通信能力的不足、多种设备应用的人为分离,也会制约应用的发展。集成性是将所有能够处理各种媒体信息的高速及并行的处理系统、大容量的存储、适合多媒体多通道的输入设备(键盘、摄像机、话筒等)和输出设备(显示器、喇叭等)、宽带的通信网络接口,以及适合多媒体信息传输的多媒体通信网络集成为一个整体。同时应具有集成一体化的多媒体操作系统,能适合于各个系统之间的媒体交换数据格式,适合于多媒体信息管理的数据库系统,适合制作和编著多媒体节目的软件,总之,多媒体系统要充分体现集成性的巨大作用。
4.实时性
实时性是指在多媒体系统中声音及活动的视频、图像、动画等这些实时性较强的信息媒体。多媒体系统提供了对这些媒体实时处理的能力,这就意味着多媒体系统在处理信息时有着严格的时序要求和很高的速度要求。当系统应用扩大到网络范围之后,这个问题将会更加突出,会对系统结构、媒体同步、多媒体操作系统及应用服务提出相应的实时性要求。
5.高质性
早期处理音像信息时,存储和输出的都是模拟信息。因模拟信号是连续的,其衰减和噪声干扰较大,且复制和传播过程中存在误差积累现象,所以这种模拟信号质量差。而以计算机处理的多媒体则以全数字化方式加工和处理声音与图像信息,精确度高,特别是复制和传播过程中不会有改变,声音和图像质量好。
1.1.3 多媒体关键技术
多媒体应用涉及许多相关技术,因此,多媒体技术是一门多学科的综合技术,其主要内容有以下几方面。
1.多媒体数据压缩/解压缩技术
数据压缩/解压缩技术是多媒体计算机走向实用化的关键。视频和音频信号不仅数据量大,需要较大的存储空间,并要求传输速度快。多媒体数据压缩/解压缩编码技术是解决这一问题行之有效的方法,采用先进的压缩编码算法对数字化的视频和音频信息进行压缩,既节省了存储空间,又提高了通信介质的传输效率,同时也使计算机能够实时处理和播放视频、音频信息。所以说视频和音频信息的压缩和解压缩技术是多媒体的关键技术。
2.多媒体专用芯片技术
专用芯片是多媒体计算机硬件体系结构的关键。因为要实现音频、视频信号的快速压缩、解压缩和播放处理,需要大量的快速计算。而实现图像的许多特殊效果(如改变比例、淡入淡出、马赛克等)、图形的处理(图形的生成和绘制等)、语音信号处理(抑制噪声、滤波等),也都需要较快的运算和处理速度。因此只有采用专用芯片,才能获得满意的效果。
多媒体计算机专用芯片可归纳为两种类型:一种是固定功能的芯片,另一种是可编程的数字信号处理器(DSP)芯片。DSP芯片是为完成某种特定信号处理设计的,一般在通用机上需要多条指令才能完成的处理,在DSP上可用一条指令完成。
最早出现的固定功能专用芯片是基于图像处理的压缩处理芯片,即将实现静态图像的数据压缩/解压缩算法做在一个芯片上,从而大大提高其处理速度。之后,许多半导体厂商或公司又推出了基于国际标准压缩编码的专用芯片,例如,支持用于运动图像及其伴音压缩的MPEG标准芯片,芯片的设计还充分考虑到MPEG标准的扩充和修改。由于压缩编码的国际标准较多,一些厂家和公司还推出了多功能视频压缩芯片。这些高档的专用多媒体处理器芯片,不仅大大提高了音频、视频信号处理速度,而且在音频、视频数据编码时可增加特技效果。
3.大容量信息存储技术
多媒体的音频、视频、图像等信息虽经过压缩处理,但仍然需要相当大的存储空间。大容量只读光盘存储器(DVD光盘)的出现,解决了多媒体信息存储空间及交换问题。DVD光盘以其存储量大、密度高、介质可交换、数据保存寿命长、价格低廉以及应用多样化等特点成为多媒体计算机中必不可少的设备。利用数据压缩技术,在一张DVD光盘上能够存取300多分钟全运动的视频图像或者十几个小时的语音信息或数千幅静止图像。
蓝光光碟(Blu-ray Disc,简称BD)是DVD之后的下一代光盘格式之一,用以存储高品质的影音以及高容量的数据存储。蓝光光碟的命名是由于其采用波长405nm(纳米)的蓝色激光光束来进行读/写操作(DVD采用650nm波长的红光读写器,CD则是采用780nm波长)。一个单层的蓝光光碟的容量为25GB或是27GB,足够录制一个长达4小时的高解析影片。
4.多媒体输入/输出技术
多媒体输入/输出技术包括媒体变换技术、媒体识别技术、媒体理解技术和综合技术。
媒体变换技术是指改变媒体的表现形式,如当前广泛使用的视频卡、音频卡都属媒体变换设备。
媒体识别技术是对信息进行一对一的映像过程。例如,语音识别是将语音映像为字、词或句子;触摸屏是根据触摸位置识别操作要求。
媒体理解技术是对信息进行更进一步的分析处理,以理解信息的内容,如自然语言理解、图像理解、模式识别等技术。
媒体综合技术是把低维信息表示映像成高维模式空间的过程,例如,语音合成器就可以把语音的内部表示综合为声音输出。
前两种技术相对比较成熟,应用较广泛,而媒体理解和综合技术目前还不成熟,只用在某些特定场合。
5.多媒体通信技术
多媒体通信要求能够综合地传输、交换各种信息类型,而不同的信息呈现出不同的特征。比如,语音和视频有较强的适应性要求,它允许出现某些文字的错误,但不能容忍任何延迟。而对于数据来说,则可容忍延迟,但却不能有错,因为即便是一个字节的错误都会改变数据的意义。
多媒体通信技术包含语音压缩、图像压缩及多媒体的混合传输技术。为了只用一根电话线同时传输语音、图像、文件等信号,必须要用复杂的多路混合传输技术,而且要采用特殊的约定来完成。
现有的通信网大都不太适应数字化的多媒体数据的传输。人们期望未来能够将多种网络进行统一,包括用于话音通信的电话网、用于计算机通信的计算机网和用于大众传播的广播电视网。对于实时性要求不高、数据量不大的应用来说,矛盾尚不突出。但一旦涉及到大量的数据,许多网络中的特性就难以满足要求。
实现多媒体通信,对不同的应用,其技术支持要求有所不同。例如,在信息点播服务中,用户和信息中心为点对点的关系,信息的传输要采用双向通路;电视中心把信息发往各用户,则要实现一点对多点的关系;而在协同工作环境应用中,各用户的关系就成为多点对多点的关系,所以多媒体通信技术要提供上述连接类型。
6.虚拟现实技术
虚拟现实技术是用计算机生成现实世界的技术。虚拟现实的本质是人与计算机之间进行交流的方法,它以其更加高级的集成性和交互性,给用户以十分逼真的体验,可以广泛应用于模拟训练、科学可视化等领域,如飞机驾驶训练、分子结构世界、宇宙作战游戏等。
虚拟现实的定义可归纳为:利用计算机技术生成一个逼真的视觉、听觉、触觉及嗅觉等的感觉世界,用户可以用人的自然技能对这个生成的虚拟实体进行交互考察。这个定义有三层含义:首先,虚拟实体是用计算机来生成的一种模拟环境,“逼真”就是要达到三维视觉,甚至包括三维的听觉及触觉、嗅觉等;其次,用户可以通过人的自然技能与这个环境交互,这里的自然技能可以是人的头部转动、眼睛转动、手势或其他的身体动作;第三,虚拟现实往往要借助于一些三维传感设备来完成交互动作,常用的如头盔立体显示器、数据手套、数据服装、三维鼠标等。