监控平台解密:IT系统风险感知和洞察
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.1 IT监控运维管理的发展历程

谈到IT监控运维管理的发展历程,有必要先区分两个重要市场,一个是运营商市场,另一个是行业和企业市场。因为这两个市场的业务方向、体量,以及管理成熟度都有比较大的差别,因此IT监控运维系统的建设也有很大差异。IT监控运维管理的目标是支撑业务运行、保障服务质量,尤其是在数据通信业务(运营商)早期阶段,这种业务差异尤为明显。

运营商同行业和企业业务结构的最大区别是,运营商的核心业务是提供数据通信服务,监控运维管理从一开始就是数据通信系统的重要组成部分,随运营商系统同步建设。IT监控运维在运营商系统内发展较早,体系较成熟。

在运营商系统内,运营商的IT监控运维管理中,网管监控部分比行业和企业用户更为复杂,这部分功能运营商称之为OSS(Operation Support System,运营支撑系统),是面向线路信号、操作维护、运行质量报表、服务申请、故障处理流程等的。OSS中相关监控主要用于监控局端线路、程控交换设备、基站及信号质量等方面。另外,还有拨测(及时发现线路故障)和网优(针对发现的问题进行网络优化)两个重要方面。早期的爱立信、北电网络、3com、摩托罗拉、朗讯、诺基亚、上海贝尔、华为等也都有自己独立的OSS网管、拨测及网优工具。

在行业和企业中,运维监控是围绕着业务系统的稳定运行和业务性能优化建立和展开的,网络监控是其早期的重点和重要组成部分,随着网络质量和稳定性的逐步提高,行业和企业用户的监控运维重点逐渐转变为业务的稳定保障、应用的性能优化,以及服务的SLA(Service Level Agreement,服务等级协议)可度量等方面。

1.1.1 新兴的中国市场(1985—1994年)

自1978年改革开放以来,我国开始引进国外先进的技术,建立、完善覆盖全国的电信基础设施网。在20世纪80年代中后期,程控交换设备开始投入使用,电话开始进入寻常百姓家庭,运营商随程控交换设备开始引入网络设备制造商配套的OSS网管软件,用于对制造商设备的操作与维护。当时的程控交换设备供应商主要有加拿大北电网络、美国AT&T、法国阿尔卡特、瑞典爱立信、芬兰诺基亚等。

1984年,当时的邮电部选择了比利时ITT贝尔公司,共同建立了我国高新技术领域第一家中外合资企业——上海贝尔(现上海诺基亚贝尔股份有限公司)。1985年,上海贝尔第一条程控交换设备生产线投产,自身设备的网管软件也配套投入使用,这是最早的国产网管软件。

1.1.2 运营商大建设期(1995—2000年)

1995年,安装一部固定电话的初装费为3000~4000元,相当于当时普通消费者10个月的工资收入。为了打破垄断,解决通信资费昂贵的问题,管理层在这一阶段进行了重大调整、拆分。1994年,电信局从邮电部独立出来,1995年,中国电信成立,同时中国联通成立。1998年,信息产业部组建,电信业实现政企分离,从中国电信又拆分出中国移动和中国卫星通信。这一阶段的拆分奠定了中国运营商格局,随后运营商进入新一轮的大建设时期。

面对中国巨大的通信市场,世界各通信设备制造巨头纷纷进入,这一时期的网管软件多为命令行方式,结合一些简单的网络质量检测工具,各厂商的网管软件只支持对自身程控交换设备的监控和操作,不能互相兼容。早期的网管软件对使用者的能力要求非常高,不仅需要精通程控交换原理,而且要非常了解所维护的网络的物理架构。

运营商需要面对的是管理不同的通信传输组网骨干设备,以及多品牌厂商的管理工具。如加拿大北电网络建设了全国的光传输骨干网,若干省份选择了芬兰诺基亚的GSM,这些设备同时存在、构建、支撑着运营商不同的业务,如固定电话、寻呼、移动通信等。由表1-1运营商大建设期的厂商可见种类之繁多。

表1-1 运营商大建设期的厂商

1.运营商网管系统

随着越来越多运营商业务系统的建立,运营商运营管理的矛盾日益凸显。为了应对这些新问题,运营商建立了网管系统OSS,OSS面向网元、信令、动力环境等方向深化建设,由国内服务商实施国外产品,并以本地化开发为主,国外产品主要有IBM Tivoli、HP Open View、BMC等。

这一时期的监控系统相对原始网络监控时代,除了具备良好的图形化界面,还具备更加完整的系统性,即六大主要功能:网络性能管理、网络故障管理、网络配置管理、网络安全管理、服务请求管理及工单管理。

2.行业企业网管工具

20世纪90年代后期,行业/企业(如税务、金融、保险、电力、石化等)IT的建设重点仍然是全国分支机构联网和传统业务电子化。虽然线路是租用运营商或自己敷设的,但线路或通信质量并不稳定。这一阶段行业/企业用户广域网建设的核心路由交换设备大量采用Cisco的设备,因此该阶段的企业用户网管工具主要是随购买设备配套的Cisco Works,以及检查局域网敷设线路信号传输质量的工具Fluke。

这一阶段的网管系统相较于早期监控系统已经比较完善,可以对网络设备包括交换机、路由器、防火墙和服务器等进行基础性能、故障的监控。行业/企业网管的重点工作是在网络建设和通信质量层面的。这一阶段对应用的质量缺乏有效的监控手段,仍然以人工巡检方式完成质量检查。

1.1.3 多元化的监控运维系统(2001—2010年)

2001—2010年,这个阶段的IT监控运维系统建设逐步体系化,企业机构开始引入ITIL(Information Technology Infrastructure Library,IT基础架构库)体系作为建设标准,监控工具也更加注重多维度和细分市场划分。客户开始注重SLA服务等级,通过建立以监控网管控制为核心的维护管理体系,形成以快速响应业务为中心的运维机制,完善面向业务的系统运行综合管理与维护方式,实现高质量、高可靠、高效率、低成本的维护目标,提高IT综合管理水平和维护效率。

随着ITIL体系的引入,IT运维监控市场也开始向两个方向发展,大厂商通过并购、整合等方式向全面化覆盖方向发展,小厂商立足自身专业技术,精细化布局专业市场。

IBM Tivoli和HP OpenView在早期IT服务领域,因各自硬件市场份额优势和销售优势,占领了大部分运营商和金融行业头部企业的IT基础架构管理和服务管理的软件市场。2005年12月,IBM以8.65亿美元收购了Micromuse公司,Micromuse的Netcool系列产品能帮助用户建立一个自动化的网络管理运维平台。Omnibus是Netcool产品的核心模块,该产品被很多企业沿用至今。

2007年7月,HP斥资16亿美元收购了Opsware公司,开始布局网络自动化和服务器自动化市场,Opsware公司是在网络设备及服务器设备自动化配置领域技术较为领先的企业。

2007年,专注于IT运维管理,包括基础架构监控、CMDB、IT资产管理和运维自动化等多个IT管理领域的BMC公司也斥资8亿美元收购了BladeLogic公司,进一步布局IT自动化市场。

亿阳信通、神州泰岳、电讯盈科、南京南瑞等一批专业的大型综合运维系统实施服务商应运而生,它们通过代理IBM、HP、BMC等的产品,在帮助运营商及金融电力等行业企业落地运营商业务运营支撑系统、ITIL实施服务的过程中,逐渐积累了IT监控运维管理核心技术。

同时,在这一时期,更多国产厂商开始打破技术垄断,诞生了许多拥有自主知识产权的高科技企业,典型的代表是华为公司和华三公司。在国内网络通信设备市场,这两家公司颇有渊源,当时华为公司主攻运营商市场,华三公司发力在企业网络建设市场。

华为公司和华三公司的发展,让国内运营商和企业通信网络建设的供应商格局发生了重大变化,这一变化也导致IT监控运维管理市场从之前的国外三大厂商(IBM、HP、BMC)垄断市场转变为更开放的市场,有了更多的参与者加入竞争。中国的ITSS(Information Technology Service Standards,信息技术服务标准)运维标准化体系也在这一时期建立,国内监控运维厂商在这一时期蓬勃发展,典型的有上海北塔软件、网利友联、上海网强、北京游龙科技、广通信达等。

除了国外几大著名厂商,细分IT监控工具市场也在这一阶段得到充分的发展,如SolarWinds在网络管理、配置管理和流量管理方面处于领先地位,Netscout的Sniffer在网络流量分析领域的领先优势一直延续至今。

1.1.4 面向云和应用(2010年至今)

随着虚拟化、云计算,以及软件定义网络和存储的发展,基础架构在这一阶段被重构,IT监控运维也转向智能化、专业化、精细化发展。之前的大型国际综合性监控运维软件逐渐被在各个细分领域研究更专业、投入更深入的开源或商业产品所替代,如可以对基础设施进行有效监控的Zabbix监控系统、对系统日志进行集中收集及分析的ELK监控系统、对容器编排系统Kubernetes进行监控的Prometheus系统、对应用调用链路进行跟踪及分析的Dynatrace系统等。