1.6.5 ILM的实施方法
信息生命周期管理对企业用户而言是一种信息技术战略,是一种理念,而不仅仅是一个产品或方案。信息化建设中最关键的是数据,数据代表着信息,它可以构成企业的核心竞争力。信息从产生的那一刻起就自然地进入一个循环,经过收集、复制、访问、迁移、退出等多个步骤,最终完成一个生命周期,而这个过程必然需要良好管理的配合,如果不能进行很好的规划,结果要么是浪费了过多的资源,要么是资源不足而降低了工作效率。
一般情况下,数据引用概率与数据寿命之间的关系,是理解数据应当如何管理的关键所在。为信息在它的整个生命过程中规划存储和迁移的方案是ILM的核心内容。
信息生命周期管理是由StorageTek首先提出来的,经过易安信(EMC)公司的发展和大力宣传,进入市场化阶段指日可待。然而我们应当认识到,信息生命周期管理作为一项企业信息化战略,不可能一蹴而就,而是一项相对长期的工作。当代的企业或多或少都已经有自己的信息系统,信息生命周期管理不可避免地要利用和继承企业目前所拥有的技术和体系结构。
EMC公司建议客户分三个阶段实施信息生命周期管理:第一步,实施自动网络存储,优化存储基础设施;第二步,提高服务等级,优化信息管理;第三步,实施集成式生命周期管理环境。
第一个阶段,各机构应消除直连式存储,逐步将存储完全网络化,然后实现存储环境自动化,以便经济有效地融合和控制存储资源,保证业务连续性。
第二个阶段,服务等级阶段的任务是:在存储网络中建立服务等级层次,然后部署初始信息管理工具,按照企业要求的变化,将信息转移到相应的服务等级层次中。利用这些工具,许多机构都能够按照相关法规的要求优化其信息管理资源。
前两个阶段是最后实现价值的基础,一般情况下,需要若干年时间才能实现信息生命周期管理的自动化。在这种集成式环境中,客户将能够在整个混合IT基础设施中贯彻企业战略精神,并在适当的时候从一个控制台为一定的服务等级提供相应的应用。
第三个阶段,借助信息生命周期管理,企业不但能经常自动制定决策,保证按照预定的业务准则和战略,以便在适当的时候为适当的应用提供适当的信息,还能按照信息价值变化的敏感性实时地进行调整。
这三个阶段使技术人员能够利用各项新技能和新方法了解自身的信息需求,并随着实际经验的积累提高自动化水平。
ILM体系分为管理服务、通用服务和自动化模块三个功能区域,每个功能区域都包含很多具体的服务模块。每个模块都清楚自己在整个自动化ILM系统内的位置和作用,模块间通过一个称为ILM知识库的数据库来与其他服务共享基础数据。模块化的设计方式使得用户可以根据需要,自主决定ILM解决方案的组成。下面我们来讨论这些组成部分以及它们对于整个体系的作用。
1.管理服务
自动化ILM体系的管理服务提供系统的操作管理功能。管理服务由四部分组成:应用程序、信息组、存储网络和平台。每层中都包括一组管理服务,每个服务提供一项具体的ILM流程功能。譬如,美国Legato公司网络服务可向信息组层提供备份/复位服务。
管理服务可以单独安装,也可以与其他的服务组合使用。自动化ILM框架并不限制使用的具体产品,通过通用标准的使用,自动化ILM为通用服务和自动化模块提供了公开的接口。这些开放性的接口允许任何的第三方管理服务、用户接口或是业务应用程序可以利用自动化ILM系统内各部分的功能,并整合它们。为了得到支持,管理服务必须和通用服务层衔接,并在自动化ILM知识库中注册名称和服务类型。基础数据用来描述业务应用、信息组以及服务水平协议。举例来说,一个第三方复制产品必须在知识库中注册名称和服务类型,并为信息组提供一个复制。
(1)应用服务
应用服务负责业务应用程序及其运行的主机环境操作。该服务包括高度的资产可用性、自动化和监控服务。这些服务通过监控应用程序及其运行环境和自动化恢复与服务流程,从而改进信息存取的可靠性。譬如,LEGATO的自动化可用性管理工具就是一个提供资产可用度保证的服务。这一服务对受控程序提供故障处理和重新启动的功能,从而为用户提供近似连续的应用服务和信息服务。
应用服务层通过ILM知识库中的基础数据进行定义,包括全部自动化ILM服务可识别的名称和服务水平协议。
(2)信息组服务
信息组为某一个应用程序或业务流程相关的所有数据子集提供一个特殊命名的对象。该名称和信息组的内容将为所有自动化ILM服务知晓并共享。由于信息组是管理服务经常操作的对象,它就构成了自动化ILM环境中的基本管理单元。举例来说,一个名为OracleInfoSet的信息组可能包括与Oracle数据库有关的数据表文件。信息组的名称和它的文件内容和属性也由自动化ILM知识库中的基础数据进行定义,信息组提供了每个管理服务所需要的输入信息。举例来说,备份服务会向信息组服务请求获得它所要备份的文件列表。基于信息组的协议,它还决定备份的目的地、频率和保存期长度。这种配置信息的能力为所有ILM服务提供了标准化管理的可能。
(3)存储网络服务
存储网络服务为物理存储设备与应用程序之间提供了一个管理接口。这些服务构成了一个抽象层,简化并提高了物理存储设备的分配和管理能力。存储网络服务可以对固定存储和移动存储设备进行操作,并对不同设备类型的细微差别进行调整适应。
(4)固定存储管理
固定存储管理提供磁盘虚拟服务和卷管理服务。磁盘虚拟服务负责将不同类型的硬件设备集中化,形成一个统一的存储池。它通过将底层存储网络的复杂性隐藏起来,从而大大地简化了存储管理工作。而卷管理服务则负责对不同存储设备的特征进行平滑处理,为应用程序和文件系统操作存储设备提供了一个抽象层面,它们使得物理上分散的多个磁盘看上去就像一个完整的存储系统。信息卷是自动化ILM主要依赖的功能之一。信息卷与传统意义的卷十分相似,只不过它专门为具体应用的信息组服务并以ILM服务为最终目的。譬如备份和复制服务正是通过信息卷来完成的。
(5)移动存储管理
移动存储管理有着自己独有的管理特点,包括设备虚拟、设备共享和介质跟踪。存储网络服务就是针对这三项困难而设计的。设备虚拟服务为移动存储设备提供一个通用的接口,该服务为不同的磁带、光盘驱动器以及它们的自动换片装置提供数据通道和控制功能。它也是一个隐藏了不同接口差异和管理的抽象层,从而为信息组服务提供了一套有效利用移动存储资源的管理方法。
由于移动存储设备比较昂贵,而且如果它们仅为特定目标服务(比如归档和备份)的话,就无法得到充分的利用,所以人们总是想方设法要共享这些设备,譬如磁带驱动器和自动换片装置。为了解决这个问题,存储网络层提供一个存储选择服务。这个服务功能负责控制设备的通道,并确定在出现两个以上服务的同时请求使用一个共享装置的时候,只有其中一个得到控制权。这使得多个服务共享存储设备成为可能,尽管它们实际上是通过分时执行来实现的。多个服务共享设备的做法可以节省大笔购买存储设备的费用,并能提高每个设备的利用效率。
技术人员经常为查找一个移动存储介质(磁带和光盘等信息介质)头痛不已,更不用说在该信息的生命周期各阶段实施有效的管理了。问题的关键就在于,当一个磁带或是光盘脱离了驱动器和自动换片装置以后,要继续跟踪它摆放的位置和决定它的保存期限就变得十分困难。正是由于及时找到这些介质很困难,将信息复制到移动存储设备的方法很少得到充分使用。而这正是跟踪服务对于ILM流程的重要性所在。它负责跟踪每个媒体的内容和位置(磁带或光盘)并记录好每个介质位置移动的过程。这为快速查找和充分利用移动存储设备提供了坚实的基础。跟踪服务同时也为用户提供保存管理,让用户及时了解每个移动介质的可使用期限。期满的媒体能够得到及时处理和再循环利用。通过管理这些介质的合理数量,从而降低存储成本和费用。同时,建立应用程序与移动存储设备之间的索引,大大地提高了系统执行的速度。
(6)检测和分配服务
这项服务涉及整个存储网络层的平台操作,帮助管理整个系统的硬件和软件存储资源。分配服务为从信息卷增加或移走的存储设备提供动态控制,而检测服务则检查当前可用的存储资源,并为可供分配的资源编制目录。这两项服务一起为磁盘虚拟和卷管理提供支持功能。当信息卷需要增加存储空间的时候,分配服务搜寻可用资源并为它分派新的存储空间。而分配服务依赖检测服务为其提供存储网络硬件的信息,包括磁盘驱动器、存储阵列、SAN、磁带驱动等网络存储资源。检测到的存储资源由ILM知识库共享给其余的ILM服务,从而节省了系统冗余。
2.通用服务
通用服务提供了一组可以共享的功能,为自动化ILM其他功能部分集中处理一些统一的通用功能方法和模型。通用服务提供下列服务:
①服务间通信:提供了自动化模块与管理服务之间的通信渠道。这一服务定义一个通用数据格式作为通信的基础。它也提供一个目录服务,使得不同应用之间能相互了解。
②安全服务:为所有服务提供证明和授权服务。为不同的用户提供一套统一的授权控制机制。
③报告:提供关于ILM服务历史统计和数据汇集的工具。通用报告系统允许用户组合不同的服务信息,并通过应用程序的视角,进一步挖掘信息背后的内容。举例来说,它可产生关于某个特殊电子邮件应用的全部信息报告。
④事件管理:提供一个集中的知识库,为查看和保存系统内各个ILM服务事件实施有效管理。
⑤通用资源检测:检测可用的通用硬件和软件,编制目录使所有自动化ILM流程可以共享它们。这将减少每个应用各自检测的工作,并为资源提供一个通用的名称。
⑥监控和修复服务:为自动化ILM环境提供了自我修复的功能。这些服务结合在一起,为系统内各问题的识别和自动纠正提供了通用的方法。
⑦安装和配置服务:提供一种安装和更新软件的通用方法。这一服务管理软件模块的新版本更新和整个系统环境中的分配。
⑧许可服务:提供全部自动化ILM软件模块的许可协议控制、统一的管理和报告。
3.自动化模块
自动化模块利用自动化ILM系统的管理服务和通用服务提供的功能,来完成更高级的操作。它主要包括:
(1)协议驱动管理模块
在所有自动化ILM给企业带来的效益中,协议驱动管理可能是受益最大的。这个自动化模块通过使用服务水平来定义自动化配置操作和服务水平管理,从而简化了ILM流程并降低了费用。协议驱动管理通过引入业务需求,提供智能管理服务。
自动化ILM协议管理负责系统协议管理。协议管理使用协议和资源数据来控制和协调服务水平。
通过读取知识库中的分类基础数据和服务水平协议,协议管理确定对具体应用程序和信息组提供怎样的服务支持,它负责配置需求服务来保证协议得到贯彻。当服务水平配置完成后,协议管理通过监控低层管理服务的运行,来保证和验证它们的正确执行。
举例来说,如果一个应用被归入接受“标准的保护服务”类别,并且这一服务水平定义为应用数据每个晚上都需要备份,那么协议管理工具将检测备份服务的执行,确保信息得到正确的保护。如果应用数据没有被备份,一个可见的通知将送达管理控制平台,提醒管理人员服务水平协议没有得到执行,同时一份电子邮件或短信将发送到适当管理者的手中。
服务水平协议被用来定义广泛的管理能力,包括:
• 关键的核心应用程序,必须在20min内得到恢复;
• 对于业务来说“重要的”应用信息,必须每个晚上进行备份;
• 连续6个月不使用的数据可以被迁移到慢速存储设备上;
• 业务部门的所有电子邮件必须在WORM(写一次、可读多次的存储设备,譬如CD-R)上保存5年。
协议管理使得管理人员易管理一组应用程序的服务水平,增加或降低服务等级,而修改服务水平协议可以影响所有受控的应用程序。这种能力简化了配置工作的复杂性,并为ILM提供了量化的配置方法。
(2)情景管理模块
当ILM的自动化程度越来越高的时候,用户可能会在启动服务水平协议前想了解其可能的结果。而ILM本身也需要具备为服务水平目标(service level objective, SLO)提供推荐协议的能力。这些能力就是我们知道的“情景分析”(what-if),或者说是预测模型。情景管理是这方面的帮助和支持,它仰仗于对不同情景影响的叙述、探究和评估的能力。在某项改动之前,通过情景分析,可以使用户对改动后的影响有一个直观的了解,做到心中有数。
(3)工作流管理模块
工作流管理负责协调复杂的ILM工作流程,这些流程经常需要人员操作的介入。工作流程管理需要自动化ILM系统与IT部门和业务部门共同合作。工作流程定义工作的顺序步骤和必要的批准环节,而批准环节就需要技术人员的参与。譬如说,协议管理需要一个附加的存储空间,这将启动一个工作流请求。第一步是识别符合应用程序需要的存储设备,这可以由分配服务自动完成。在空间得到分配之前,这项需求的业务线经理拥有成本费用批准权。工作流程管理将请求通过电子邮件发往业务经理,得到业务经理批准后,存储扩展流程得以继续。
(4)分类管理模块
对信息进行识别和分类是令管理人员最头痛的一件事情。分类管理模块负责帮助管理人员识别和分类已存在的应用程序和信息。使用信息检测技术和分类模板来刻画程序和数据使用特征,分类管理模块帮助用户建立适合企业的初始分类,并对现有程序和信息的分类提供建议,然后用户可以接受、拒绝或修改这些分类建议。分类定义完成以后,通过基础数据记录在自动化ILM知识库中,可以被其他ILM服务调用。当企业环境中有大量的数据要处理,分类管理模块能够大大地提高信息分类处理速度。
(5)服务水平管理
服务水平管理位于自动化ILM结构的顶层。服务水平管理监控并处理在业务部门和技术部门之间建立的服务水平协议(service level agreement, SLA)。服务水平管理维护应用程序、ILM服务以及业务部门之间的三方关系。服务水平管理获取业务部门对某项应用程序的服务水平需求,然后提供评估和跟踪功能,以确保该项服务水平得到实施。如果服务水平没有达到标准,业务部门和技术部门将接到通知,要求他们要么修改需求,要么纠正系统来解决问题。服务水平管理也提供“费用反馈”功能,它向业务部门报告该部门使用的计算资源和相关费用。