高可用可伸缩微服务架构:基于Dubbo、Spring Cloud和Service Mesh
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.6 架构的不同风格

典型的企业级应用系统或互联网应用系统一般通过Web提供一组业务服务能力。这类系统包括提供给用户操作的、运行于浏览器中具有UI的业务逻辑展示和输入部分,运行于服务器端、用后端编程语言构建的业务逻辑处理部分,以及用于存储业务数据的关系数据库或其他类型的存储软件。

根据软件系统在运行期的表现风格和部署结构,我们可以粗略地将其划分为两大类:

(1)整个系统的所有功能单元整体部署到同一个进程(所有代码可以打包成一个或多个文件),我们可以称之为“单体架构”(Monolithic Architecture)。

(2)整个系统的功能单元分散到不同的进程,然后由多个进程共同提供不同的业务能力,我们称之为“分布式架构”(Distributed Architecture)。

任何一个体系(产品、平台、商业模式等)想要发展壮大,途径只有两个模式。

(1)容器模式:从外部提供越来越多的资源和能力,注入体系的内部,不断地从内扩充自己。单体架构的系统类似这种模式。

(2)生态模式:以自己的核心能力为内核,持续地在外部吸引合作者,形成一个可以不断成长的生态体系。分布式架构越来越像这种模式。

再结合软件系统在整个生命周期的特点,我们可以进一步区分不同的架构风格。

对于单体架构,我们根据设计期和开发实现期的不同模式和划分结构,可以分为:

● 简单单体模式——代码层面没有拆分,所有的业务逻辑都在一个项目(project)里打包成一个编译后的二进制文件,通过这个文件进行部署,并提供业务能力;

● MVC模式——系统内每个模块的功能组件按照不同的职责划分为模型(Model)、视图(View)、控制器(Controller)等角色,并以此来组织研发实现工作;

● 前后端分离模式——将前后端代码耦合的设计改为前端逻辑和后端逻辑独立编写实现的处理模式;

● 组件模式——系统的每一个模块拆分为一个子项目(subproject),每个模块独立编译打包成一个组件,所有需要的组件一起再部署到同一个容器里;

● 类库模式——A系统需要复用B系统的某些功能,这时可以直接把B系统的某些组件作为依赖库,打包到A系统来使用。

对于分布式架构,我们根据设计期的架构思想和运行期的不同结构,可以分为:

● 面向服务架构(Service Oriented Architecture, SOA)——以业务服务的角度和服务总线的方式(一般是WebService与ESB)考虑系统架构和企业IT治理;

● 分布式服务架构(Distributed Service Architecture, DSA)——基于去中心化的分布式服务框架与技术,考虑系统架构和服务治理;

● 微服务架构(MicroServices Architecture, MSA)——微服务架构可以看作面向服务架构和分布式服务架构的拓展,使用更细粒度的服务(所以叫微服务)和一组设计准则来考虑大规模的复杂系统架构设计。

此外,传统的企业集成领域的EAI架构模式,各个系统还是独立部署的,但是各个系统之间的部分业务使用特定的技术打通了,因此我们可以看作单体和分布式之间的过渡状态。

也有人把以上的各个架构风格总结为4个大的架构发展阶段,如图1-6所示。

图1-6

1.单体架构:简单单体模式

简单单体模式是最简单的架构风格,所有的代码全都在一个项目中。这样研发团队的任何一个人都可以随时修改任意的一段代码,或者增加一些新的代码。开发人员在自己的PC上就可以随时开发、调试、测试整个系统的功能。不需要额外的一些依赖条件和准备步骤,我们就可以直接编译打包整个系统代码,创建一个可以发布的二进制版本。在一个新团队的创立初期,需要迅速从0到1,抓住时机实现产品,并以最短时间推向市场,可以省去各种额外的设计,直接上手干活,争取了时间,因而这种方式是非常有意义的。

但是这种简单粗暴的方式对于一个系统的长期稳定发展确实有很多坏处。如同一个新出生的小狗野蛮生长,如果缺乏正确的教导和规则的约束,最后成为一条忠实的导盲犬还是一条携带病毒的狂犬,就不得而知了。

第一,简单单体模式的系统存在代码严重耦合的问题。所有的代码都在一起,就算按照package切分成不同的模块,不同模块的代码还可以直接相互引用,这就导致系统内对象之间的依赖关系混乱。修改一处代码,可能会影响一大片的功能无法正常使用。为了保障每次上线时的可靠性,我们必须花费很多的精力做大量的回归测试。对于经常需要修改维护的系统,这种代价是可怕的。

第二,简单单体模式的系统变更对部署影响大,并且这个问题是所有单体架构系统都存在的问题。系统作为一个单体部署,每次发布的部署单元就是一个新版本的整个系统。系统内的任何业务逻辑调整都会导致整个系统的重新打包、部署、停机、再重启,进而导致系统的停机发布时间较长。每次发布上线都是生产系统的重大变更,这种部署模式大大增加了系统风险,降低了系统的可用性。

第三,简单单体模式的系统影响开发效率。如果一个使用Java的简单单体项目代码超过100万行,那么在一台笔记本电脑上修改代码后执行自动编译,可能需要等待数十分钟以上,并且内存可能不够编译过程使用,这是非常难以忍受的。

第四,简单单体模式打包后的部署结构可能过于庞大,导致业务系统启动很慢,进而也会影响系统的可用性。这一条也是所有单体架构的系统都有的问题。

第五,扩展性受限,同样是所有单体架构都有的一个问题。如果任何一个业务功能点存在性能问题,那么都需要多部署几个完整的实例,再加上负载均衡设备,才能保证整个系统的性能能够支撑用户的使用。

所以,简单单体模式比较适用于规模较小的系统,特别是需要快速推出原型实现,以质量换速度的场景。

2.分布式架构:面向服务架构(SOA)

随着IT技术逐渐成为各行各业的基础性支撑技术之一,很多大型公司内部的IT系统规模越来越大,传统单体架构思想的不足越来越明显。针对如何更好地利用企业内部的各个IT系统能力,解决数据孤岛问题,整合业务功能,先是出现了企业应用集成(Enterprise Application Integration, EAI)解决方案,即通过对现有各系统的数据接口改造,实现系统互通(特别是异构系统)。这样不同系统的数据就可以被整合到一起了。在大量EAI项目实施的基础上,架构设计关注的不再是单个的项目,而是企业的整个IT系统集合。架构师们以超越单体架构的分布式思想和业务服务能力的角度来看待问题,这样面向服务架构就发展起来了。

2006年IBM、Oracle、SAP、普元等公司一起建立了OSOA联盟,共同制定SCA/SDO标准。2007年4月,国际标准组织OASIS宣布成立OASIS Open Composite Services Architecture(Open CSA)委员会,自此,OSOA的职能移转至Open CSA组织。

SOA的概念最初由Gartner公司提出,2000年以后,业界普遍认识到SOA思想的重要性。从2005年开始,SOA推广和普及工作开始加速,几乎所有关心软件行业发展的人士都开始把目光投向SOA,各大厂商也通过建立厂商间的协作组织共同努力制定中立的SOA标准:SCA/SDO规范。同时产生了一个Apache基金会顶级项目Tuscany作为SCA/SDO的参考实现。SCA和SDO构成了SOA编程模型的基础。经过十多年的广泛探索研究和实际应用,SOA本身的理论、相关技术、工具等也已经发展到成熟、稳定的阶段,在信息化系统建设时普遍采用了SOA架构思想。

1)服务与SOA

面向服务架构(SOA)是一种建设企业IT生态系统的架构指导思想。SOA的关注点是服务。服务是最基本的业务功能单元,由平台中立性的接口契约来定义。通过将业务系统服务化,可以将不同模块解耦,各种异构系统间可以轻松实现服务调用、消息交换和资源共享。

(1)从宏观的视角来看,不同于以往的孤立业务系统,SOA强调整个企业IT生态环境是一个大的整体。整个IT生态中的所有业务服务构成了企业的核心IT资源。各个系统的业务拆解为不同粒度、不同层次的模块和服务。服务可以组装到更大的粒度,不同来源的服务可以编排到同一个处理流程,实现非常复杂的集成场景和更加丰富的业务功能。

(2)从研发的视角来看,系统的复用可以从以前代码级的粒度,扩展到业务服务的粒度;能够快速应对业务需求和集成需求的变更。

(3)从管理的角度来看,SOA从更高的层次对整个企业IT生态进行统一的设计与管理,对消息处理与服务调用进行监控,优化资源配置,降低系统复杂度和综合成本,为业务流程梳理和优化提供技术支撑。

在SOA体系下,应用软件被划分为具有不同功能的服务单元,并通过标准的软件接口把这些服务联系起来,以SOA架构实现的企业应用可以更灵活快速地响应企业业务变化,实现新旧软件资产的整合和复用,降低软件整体成本。

2)SOA战略

SOA的实施对整个IT生态环境有重要的影响,作为一种重大的IT变革和技术决策,必然要自上而下地进行。必须获得管理层的支持,由技术决策层面直接推动,并和技术部门、相关业务部门一起,根据目前各个IT业务系统的现状,统一规划SOA战略和分阶段目标,制定可行方案与计划步骤,逐步推进实施。

3)SOA落地方式

SOA的落地方式与水平,跟企业IT特点、服务能力和发展阶段直接相关。目前常见的落地方式主要有分布式服务化和集中式管理两种。

(1)分布式服务化。

互联网类型的企业,业务与技术发展快,数据基数与增量都大,并发访问量高,系统间依赖关系复杂、调用频繁,分布式服务化与服务治理迫在眉睫。通过统一的服务化技术手段,进一步实现服务的注册与寻址、服务调用关系查找、服务调用与消息处理监控、服务质量与服务降级等。现有的一些分布式服务化技术有Dubbo(基于Java)、Finagle(基于Scala)和ICE(跨平台)等。

(2)集中式管理化。

传统企业的IT内部遗留系统包袱较重,资源整合很大一部分工作是需要打通新旧技术体系的“任督二脉”,所以更偏重于以ESB作为基础支撑技术,以整合集成为核心,将各个新旧系统的业务能力逐渐在ESB容器上聚合和集成起来。比较流行的商业ESB有IBM的WMB和Oracle的OSB,开源ESB有Mule、ServiceMix、JBossESB、wso2esb和OpenESB。

商业的ESB,一般来说除了功能丰富,配套设置都比较齐全,对于比较简单的场景来说可以做到开箱即用,维护性也比较强,但同时过于复杂、难用,内部的设计实现基本是黑盒,并且购买费用比较高。

开源的ESB,由于开发成本和通用性、开放性的考虑,往往在ESB Server上做得比较强大、扩展性比较好,但是配套设置做得较差(这也是绝大多数开源项目共有的问题,不仅是开源ESB的问题)。对企业来说可管理性非常重要,选择开源ESB需要结合企业的实际情况,一步步地积累,下大功夫来做好。

一方面,集中式管理的SOA,其优势在于管理和集成企业内部各处散落的业务服务能力,同时一个明显的不足在于其中心化的架构方法,并不能解决各个系统内部的问题。另一方面,随着自动化测试技术、轻量级容器技术等相关技术的发展,分布式服务技术越来越向微服务架构的方向发展。

EIP(Enterprise Integration Patterns,企业集成模式)是集成领域的圣经,也是各种消息中间件(MOM)和ESB的理论基础。我们在MQ和ESB中常见的各种概念和术语,基本都来自EIP,比如消息代理、消息通道、消息端点、消息路由、消息转换、消息增强、信息分支、消息聚合、消息分解、消息重排等,《企业集成模式:设计、构建及部署消息传递解决方案》一书中详细地描述了它们的内容与特点。

EIP的直接实现一般叫EIP框架,开源的知名EIP框架有两个:Camel和Spring Integration。EIP可以作为ESB的基础骨架,在这个基础上填充其他必要的部分,定制出来一个ESB容器。

EIP的介绍可以看这里:http://www.enterpriseintegrationpatterns.com/

4)SOA的两大基石:RPC与MQ

SOA关注于系统的服务化,不同系统服务间的相互通信就成为一个重要的话题。随着RPC和MQ技术的发展,这两种技术逐渐成为SOA的两大基石,也是分布式技术体系里的重要基础设施。

(1)RPC(Remote Procedure Call,远程过程调用)。

两个不同系统间的数据通信,往往可以通过Socket+自定义数据报文来实现。但是这种方式比较烦琐,需要针对每个通信场景定义自己的数据格式和报文标准,甚至交互的行为、异常和错误的处理等。有没有一种通用的技术手段呢?答案就是RPC技术。

RPC是一种通用性的系统通信手段,使得我们可以像调用本地方法一样调用远程系统提供的方法。一个场景的RPC机制如图1-7所示。

图1-7

在RPC的调用关系里,我们把提供具体的调用方法的系统称为服务提供者(Provider),调用服务的系统称为服务消费者(Consumer)。把对象转换为便于网络传输的二进制或文本数据的过程称为序列化(Serialization);二进制或文本数据再还原为对象的过程称为反序列化(Deserialization)。我们可以看到,典型的RPC处理机制包括两部分:

● 通信协议,可以是基于TCP的,也可以是基于HTTP的。

● 数据格式,一般是一套序列化+反序列化机制。

常见的RPC技术有Cobra、RMI、.NET Remoting、WebService、JSON-RPC、XML-RPC、Hessian、Thrift、Protocol Buffer、gRPC等。按照序列化机制的特点,我们可以把RPC技术分为文本的(WebService、JSON-RPC、XML-RPC等)和二进制的(RMI、Hessian、Thrift、Protocol Buffer等)。按照常见的通信协议来看,我们又可以分为基于HTTP的(WebService、Hessian等)和基于TCP的(RMI、.NET Remoting等)。按照是否可以用于多个不同平台,又可以分为平台特定的(RMI是Java平台特定的,.NET Remoting是.NET平台特定的)和平台无关的(比如WebService、JSON-RPC、Hessian等可以用于Java.Net/PHP/Python等就是平台无关的)。

在Java里,我们一般可以基于JDK自带的动态代理机制+Java的对象序列化方式实现一个简单的RPC,由于动态代理和Java对象序列化都比较低效,导致这种方式性能较低。目前更常见的是基于AOP和代码生成技术实现代理存根(stub)和服务存根(skeleton),然后用一个紧凑的二进制序列化方式实现一个高效的RPC框架。

按照调用方式来看,RPC有四种模式:

● RR(Request-Response)模式,又叫请求响应模式,指每个调用都要有具体的返回结果信息。

● Oneway模式,又叫单向调用模式,调用即返回,没有响应的信息。

● Future模式,又叫异步模式,调用后返回一个Future对象,然后执行完获取返回结果信息。

● Callback模式,又叫回调模式,处理完请求以后,将处理结果信息作为参数传递给回调函数进行处理。

这四种调用模式中,前两种最常见,后两种一般是RR和Oneway方式的包装,所以从本质上看,RPC一般对于客户端来说是一种同步的远程服务调用技术。与其相对应的,一般来说MQ恰恰是一种异步的通信技术。

(2)MQ(Message Queue,消息队列)。

现在我们来考虑异步的远程调用,如果同时存在很多个请求,那么该如何处理呢?进一步地,由于不能立即获取处理结果,假若需要考虑失败策略、重试次数等,那么应该怎么设计呢?

如果N个不同系统相互之间都有RPC调用,这时整个系统环境就是一个很大的网状结构,依赖关系有N×(N-1)/2个,如图1-8所示。任何一个系统出问题,都会影响剩下N-1个系统,怎么降低这种耦合呢?

图1-8

基于这些问题,我们发展出MQ(消息队列)技术,所有的处理请求先作为一个消息发送到MQ(也叫作Message Broker),接着处理消息的系统从MQ获取消息并进行处理。这样就实现了各个系统间的解耦,同时可以把失败策略、重试等作为一个机制,对各个应用透明,直接在MQ与各个调用方的应用接口层面实现即可,如图1-9所示。

图1-9

一般来说,我们把发送消息的系统称为消息生产者(Message Producer),接收处理消息的系统称为消息消费者(Message Consumer)。

根据消息处理的特点,我们又可以总结两种消息模式:

● 点对点模式(Point to Point, PTP),一个生产者发送的每一个消息都只能由一个消费者能消费,看起来消息就像从一个点传递到了另外一个点。

● 发布订阅模式(Publish-Subscribe, PubSub),一个生产者发送的每一个消息都会发送到所有订阅了此队列的消费者,这样对这个消息感兴趣的系统都可以获取这个消息。

通过这两种消息模式的灵活应用及功能扩展,我们可以实现各种具体的消息应用场景,比如高并发下的订单异步处理,海量日志数据的分析处理等。如果要总结消息队列在各类架构设计中能起到的作用,一般有如下几点:

● 为系统增加了通用性的异步业务处理能力,这个在前面讨论过了。

● 降低系统间的耦合性,无论开发期的引用关系依赖,还是运行期的调用关系依赖,都明显简化或降低了。通信的双方只需要定义好消息的数据格式(消息头有什么字段,消息体是什么格式的数据),就可以各自进行开发和测试,最后再各自上线即可集成到一起。

● 提升了系统间通信可靠性,无论通信本身的可靠性上(请求响应机制、重试),还是业务意义上(处理顺序、事务、失败策略)的可靠性,都相比RPC等方式有所增强。

● 提升了系统的业务缓冲能力,一般又叫削峰填谷,指的是经过MQ作为中间件的缓冲,如果业务量突然增大时可以先把处理请求缓冲到队列中,再根据业务消费处理能力逐个消息处理,保障了系统不会因为突然爆发的大量请求而过载瘫痪,影响系统的连续服务能力。

● 增强了系统的扩展能力,通过消息队列处理业务,消费端的处理能力如果不够,一般可以随时多加几个消费者来处理,从而可以直接扩展系统的业务处理能力,而不需要额外的代价。

3.分布式架构:微服务架构(MSA)

随着互联网技术的飞速发展,我们发现大型项目的设计开发和维护过程中,存在如下几个重要的困难点。

● 扩容困难

我们之前开发项目用的是虚拟机,每次上线项目需要加机器时总会遇到资源不足的情况,要走非常复杂的工单审批流程,还要与运维人员不断PK,才能申请下来资源,整个流程冗长,机器资源申请困难。

● 部署困难

每次上线采用专人进行部署,上线之前需要与上线人员沟通上线的环境,防止上线出错。

● 发布回滚困难

每次上线发现问题后,需要重新在SVN/GIT主干上面进行代码编译,但有时候会因为各种问题回滚失败,而且重新编译很耗时,导致回滚缓慢。

● 适配新技术困难

不同的模块采用不同的语言开发,在架构中做技术升级都很困难,或者不支持技术升级。

● 快速开发困难

复杂项目中采用单体应用或简单地分拆成2~3个系统,里面集成了太多功能模块,无法快速进行功能开发,并且很容易牵一发动全身。

● 测试困难

测试人员没有自动化测试框架或Mock系统,只能采用简单的人工测试流程,而且还经常发生功能覆盖不全面等问题。

● 学习困难

业务变化快,功能和项目结构都太复杂,整个项目中的逻辑关系相互关联影响,采用的技术五花八门,技术本身的更新换代也很快,导致技术人员的学习曲线非常陡峭。

针对如何解决这些问题,“微服务架构”应运而生。

1)什么是微服务

微服务这个概念最早是在2011年5月威尼斯的一个软件架构会议上讨论并提出的,用于描述一些作为通用架构风格的设计原则。2012年3月在波兰克拉科夫举行的33rd Degree Conference大会上,ThoughtWorks首席咨询师James Lewis做了题为“Microservices - Java, the Unix Way”的演讲。这次演讲里,James讨论了微服务的一些原则和特征,例如单一服务职责、康威定律、自动扩展、DDD等等。

微服务架构则是由Fred George在2012年的一次技术大会上所提出的,在大会的演讲中,他讲解了如何分拆服务,以及如何利用MQ来进行服务间的解耦,这就是最早的微服务架构的雏形。而后由Martin Fowler发扬光大,并且在2014年发表了一篇著名的微服务文章,这篇文章深入全面地讲解了什么是微服务架构。随后,微服务架构逐渐成为一种非常流行的架构模式,一大批的技术框架和文章涌现出来,越来越多的公司借鉴和使用微服务架构的相关技术。

The microservice architectural style is an approach to developing a single application as a suite of small services, each running in its own process and communicating with lightweight mechanisms, often an HTTP resource API. These services are built around business capabilities and independently deployable by fully automated deployment machinery. There is a bare minimum of centralized management of these services , which may be written in different programming languages and use different data storage technologies.

以上定义引用自http://martinfowler.com/articles/microservices.html。通过Martin Flowler的这段微服务描述,可以抽象出以下几个关键点:

● 由一些独立的服务共同组成应用系统;

● 每个服务单独部署、独立运行在自己的进程中;

● 每个服务都是独立的业务;

● 分布式管理。

通过几个关键点可以看出微服务重在独立部署和独立业务,所谓的微服务,并不是越小越好,而是通过团队规模和业务复杂度由粗到细的划分过程,所遵循的原则是低耦合和高内聚,如图1-10所示。

图1-10

● 低耦合

修改一个服务不需要同时修改另一个,每个微服务都可以单独修改和部署。

● 高内聚

把相关的事务放在一起,把不相关的排除出去,聚集在一起的事务只能干同一件事。

2)微服务和SOA的区别

(1)微服务只是一种经过良好架构设计的SOA解决方案,是面向服务的交付方案。

(2)微服务更趋向于以自治的方式产生价值。

(3)微服务与敏捷开发的思想高度结合在一起,服务的定义更加清晰,同时减少了企业ESB开发的复杂性。

(4)微服务是SOA思想的一种提炼!

(5)SOA是重ESB,微服务是轻网关。

3)大规模使用微服务

使用微服务也面临由单体项目向微服务项目过渡的问题,而采用微服务架构后意味着服务之间的调用链路会比以前延长了很多,在调用链路上发生故障的概率也就随之增大,同时调用链路越长,性能越会受影响。微服务架构中是存在很多陷阱的,并不是简单地拿来使用就可以,所以企业要大规模使用微服务不仅仅是从思想和业务上面进行合理划分,还需要诸多技术组件,以及高效的运维来协同合作,如图1-11所示。

图1-11

● 防止雪崩

当一个服务无法承受大请求压力的时候,是否会影响所依赖的其他服务?这时候可以考虑限流等措施。

● 功能降级

当某个服务出现故障时,是否有容错手段能够让业务继续运行下去,而不影响整体应用。

● 幂等

当用户多次下同一订单时,得到的结果永远是同一个。

● 缓存

当请求量较大时,为避免对数据库造成较大压力,可以适当将一些变化较小、读取量较大的数据放入缓存。

● 超时

超时时间对于调用服务来说非常重要,超时时间设置太长可能会把整体系统拖慢,而设置短了又会造成调用服务未完成而返回,我们在实际工作中需要根据业务场景进行分析,选择一个恰当的超时设定值。

● 熔断

当请求下游的服务时发生一定数量的失败后,熔断器(断路器)打开,接下来的请求快速返回失败。过一段时间后再来查看下游服务是否已恢复正常,重置熔断器。

● 服务隔离

当所调用的服务发生故障时,上游服务能够隔离故障以确保业务能够继续运行下去

● 可伸缩

当并发量较大,原有服务集群无法满足现有业务场景时,可以采用扩容策略;当并发量较小时,服务集群可以采用缩容策略,以节省资源。

● 数据库拆分

通过为每个独立部署的服务提供单独的数据库,降低了数据库耦合,也让不同微服务间隔离得更彻底,系统更健壮,同时也利于针对不同数据分别进行扩容和其他处理。

● 可扩展

系统经过良好的设计,可以随时灵活地以比较小的改动代价增加新的功能或能力。