2.1 边缘云计算的起源
第1章已介绍过,从整体的IT 格局来看,信息化系统大致经历了三个大平台,从大型机时代到开放式系统和x86的兴起,最后走到CAMS(云计算、大数据、移动互联、社交网络)。在这个过程中,企业产生的数据量在不断增加,同时应用场景要求的时延则越来越低。在数字化转型上,最初从聚焦企业的ERP 系统,转换到直接帮助生产的边缘系统,信息量规模不断增大,要求处理后数据的返回时延越来越低。原来的信息化系统主要满足ERP 等传统业务的需求,但是现在信息化更多的是要渗透到具体的生产中,不再是一个原来的辅助系统。
在以前,边缘侧对待数据无非做这4件事情:数据采集、简单的数据格式化、数据压缩、数据传输。以一个边缘侧的应用为例,用户在购物时,需要在终端购物APP 中输入商品信息,即为最初的数据采集。随后,APP 将按照购物软件的要求对采集到的数据进行格式化处理,转换成符合应用的数据格式。当与商家进行交流时,如果涉及图片等数据量较大的信息,APP 将会对内容进行压缩,最后将处理好的数据传输到商家服务器端。这是在没有边缘计算时的一个典型边缘侧应用,在面向个人用户时,对数据传输的准确性和网络时延要求不高,即使在传输过程中出现少量的丢包或者时延高了零点几秒,对用户的应用影响也不大,是尽力而为的应用。但是在边缘计算时代,如远程医疗手术场景下,些许的时延将造成很严重的后果。
边缘计算是在实际应用场景驱动下发展起来的。随着多种业务应用的发展,对时延性能的要求越来越高。如果将所有的计算均集中到云数据中心处理,将导致非常高的时延,为了应对业务发展的需求,需要将云数据中心要处理的业务下沉至网络边缘,这促进了边缘计算的发展,即IT 基础设施的合久必分。边缘能力的增强,使得原来的数据采集、格式化、压缩、传输4项基本要求在性能上得到了提升。
在讲边缘计算起源之前,我们先对边缘计算、雾计算、云计算的关系进行澄清。边缘云计算是边缘计算和云计算的结合。雾计算可被认为是云计算的子集,其初衷是为了将计算能力下沉至网络边缘,在靠近数据源头的位置进行部分数据处理,实现处理时延的降低、减少发送到云端的数据量等。而边缘计算在众多IoT 垂直领域,如工业、智慧城市、石油、天然气等,通常被认为是一种成熟的技术,主要用于提供控制功能。目前,对于边缘计算和雾计算的概念区分日渐模糊。边缘计算可以看作雾计算的一个子集,其与雾计算最本质的区别在于边缘计算更贴近数据源头,在承担应用功能方面相对简单。图2-1表示了边缘计算、雾计算和云计算之间的关系,可以看出它们在功能上的重叠。
图2-1 边缘计算、雾计算和云计算之间的关系
边缘计算通常使用嵌入式设备,主要用于少量的设备感知和服务感知,但无法感知到整个域的设备状态,也没有物联网的垂直感知和整合,而安全范围与数据分析范围仅限于单个设备。雾计算的计算和感知范围较边缘计算的范围要广。雾计算使用嵌入式设备,同时也使用物理机和虚拟机承载用于实时控制的软PLC(可编程逻辑控制器)。雾节点能够为应用程序提供虚拟化环境,支持丰富的虚拟化,在边缘提供数据分析和故障检测服务。雾计算将云计算连续扩展到雾级别,拥有完整的网络,可感知整个雾域,控制域中的所有设备,支持连接多个物联网垂直域,能够从边缘的多个设备收集、处理数据,并进行进一步的分析、异常检测和系统优化,甚至进行机器学习。
当前,边缘云计算正在重新定义边缘计算的范畴,包含了一些雾计算的功能,如互操作性、本地安全等。边缘计算与雾计算的边界正趋向融合。在后续章节中,本书将边缘计算和雾计算统称为边缘云计算,或边缘云。
“中心云”采用集中式部署的方式,通过云数据中心对数据进行集中处理。随着应用场景及技术的发展,计算开始呈现分散化处理的趋势。以前,CPU 等计算单元价格相对较贵,生产中产生的数据量相对较少。此时,数据能够围着计算跑,可以把所有的数据集中到云数据中心进行计算,而且在这种情况下性价比最高。随着边缘侧计算能力的提升,产生的数据越来越多。在互联网特别是移动互联网、大数据、人工智能时代,数据量非常大,数据传输的成本非常高,远大于将计算部署在本地的成本。此时,需要计算围着数据跑,将计算能力部署在数据源侧,降低成本。除传统的CPU 外,又有了GPU芯片,可以进行人工智能的训练;还有智能网卡,在网卡上可以叠加计算能力,处理更多网络数据;还有智能存储设备,在存储器上增加芯片,进行加密算法处理等。这一切核心都是让数据不再跑“冤枉”路,而把计算能力靠近数据进行本地化处理,形成了计算的分散化部署,促进了边缘计算的发展。
随着物联网发展和5G 的到来,需要对原本在云数据中心进行计算的集中式数据处理方式进行重新审视。在传统云数据中心部署有计算、存储资源,所有的数据均在云数据中心处理。这种集中处理的模式,虽然可以在一定程度上创造规模经济效益,但是在万物互联的时代,也会出现一些难以解决的问题。
首先,云计算面临低时延处理瓶颈。5G 提升了网络的大带宽、泛连接、低时延特性,面向个人用户及行业用户催生了一系列的创新应用,如AR/VR、互动直播、自动驾驶、智能制造等。这些应用的使用,除需要满足计算能力之外,对网络时延也提出了极高的要求。AR/VR 的网络时延通常需要低于15ms,以实现对视频的实时渲染;互动直播的时延通常需要低于10ms,以实现对视频的转码;自动驾驶的时延通常需要低于1ms,以实现AI 推理;智能制造应用的时延通常需要低于1ms,以进行基于AI 的精准控制。当前的云数据中心,由于计算资源部署位置远离数据源,在时延上不能满足应用需求,因此时延问题是边缘云计算要解决的首要问题。
其次,云计算面临数据处理的网络压力。随着工业互联网、智慧城市、能源互联网等传感器应用的快速发展,网络边缘侧存在着数以亿计的海量互联设备。通过对各种类型数据的采集,将产生无比巨大的数据,数据增长呈现爆发式趋势。传统线性增长的云计算模式无法跟上爆发式增长的数据计算要求。部署在网络边缘侧的传感器设备,如工业互联网、智慧城市等,将产生大量生产环节的关键性实时数据。大量数据的集中处理,对网络带宽提出了较高的要求。如果将数据传输回云数据中心,将对网络产生巨大压力。
另外,云计算面临安全隐私方面的问题。随着社交、购物、视频等应用的开展,越来越多的用户信息被传输到云数据中心进行处理。用户平面临着越来越严重的隐私泄露等问题。例如家庭摄像头应用,用于家庭监控等目的,在监控过程中,产生了大量视频数据,增加了泄露隐私数据的风险,同时也出现了关于摄像头入侵、视频泄露的案例。如果在边缘侧对数据进行类似云计算的安全加密等隐私保护处理,将大大增强对用户隐私安全的保护。促进边缘侧的计算,以协调、整体考虑的云计算范式进行。边缘云计算就是为解决上述问题而生的。