数据中心UPS供电系统设计与故障处理
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.2.3 UPS供电方案的可靠性与可用性

在冗余UPS供电系统的设计中,双变换在线式 UPS应是首选机型。双变换在线式UPS在正常工作时,它应在100%的时间内,向用户的负载提供100%的经逆变器变换后的高质量电源。而非双变换在线式UPS(后备式UPS、在线互动式UPS和双变换电压补偿在线式UPS)在当市电供电正常时,它们向用户的负载所提供的是仅对市电电源的输入电压进行不同程度稳压精度调整的电源。在这种电源中,难于消除来自市电电网各种高能瞬态浪涌、频率突变、电压失真度及各种电磁干扰所可能带来的种种不利影响。在这种供电体制下,常见的故障现象有:①计算机、网络服务器莫明其妙地死机;②网络的数据传输率急剧下降;③调制解调器及服务器的上机掉网率提高;④网关、路由器产生偶发性的自动关机或自检误启动等。

对于应用于数据中心的UPS,是否拥有网络环境的监控软件是选购UPS必备的技术条件,并且UPS监控软件功能的强弱也成为选择UPS的另一个考虑重点。监控软件在网络上的运行要考虑多种平台的可操作性,在网络上的各类计算机会有不同的操作系统。因此,想要进行网络监控就必须兼容不同的操作平台。无论是何种网络(LAN、WAN或Internet),要求UPS的监控软件均能运行。监控要具有保密性,此点是在网络上使用监控软件必须具备的功能,否则,网络的安全性会受到更严重的威胁。在数据中心中使用的UPS除了需要有上述功能外,对于任何一种电源事件的发生,如UPS过载、市电断电、蓄电池低电压、蓄电池故障等均要有报警服务,并且报警服务要能以各种方式传递至UPS供电的所有设备,此即网络广播报警功能。此外,当无人值守时,在UPS进入由蓄电池供电状态后,在蓄电池快放电终了关机前,UPS的网络广播报警功能会告知所有UPS供电的设备,以激活设备的自保护功能。

为了提高数据中心UPS供电系统运行的可靠性,一般采用的方法有两种,即供电系统的冗余连接和负载设备的双电源或三电源冗余输入。提高可用性也有两个途径,即延长电源的MTBF和缩短MTTR。当UPS的质量达到一定程度后,再延长MTBF的代价较大,而且效果也不太显著,因为总不能使MTBF无穷长。然而,缩短MTTR的效果却比较明显,如果MTTR缩短为零(这种可能性是存在的,而且也不难实现),那么可用性就是100%。

采用UPS冗余并联方法就可达到这个目的。例如,如果两台同容量的UPS并联,其中任何一台都具有承担100%负载的能力,那么两台并联后就有了200%的供电能力,所以其中任何一台因故障而停机后,另一台仍可以继续供电,使负载设备的工作得以不间断地连续运行,达到了使MTTR缩短为零的目的。

负载设备采用多电源入口,也可达到上述目的。多电源入口意味着需要多个电源供电,任何一个入口的电源都具有100%的带负载能力,所以其中任何一个电源因故障而停机后,另外的电源仍可以继续供电,使负载设备的工作得以不间断地连续运行。

1.热备份连接及其可靠性

热备份连接可用来提高可靠性,也就是说,当单台 UPS已不能保证满足用户提出的可靠性要求时,就可以再接一台同规格的单机来提高可靠性。两台 UPS热备份连接的原理图如图2-8所示。为了有一个量的概念,图2-9所示为单台 UPS的可靠性模型图。

图2-8 两台UPS热备份连接的原理图

图2-9 单台UPS的可靠性模型图

在图2-9中,RU是不带旁路时单台UPS主机的可靠性,设RU=0.99;RB是旁路的可靠性,为了便于计算,也设RB=0.99。也就是说,此二者的可靠性都是99%,即不可靠性是1%。这两部分是冗余并联的关系。根据可靠性并联的计算公式,单台UPS的可靠性R1就是

代入数值,则

R1=1-(1-0.99)(1-0.99)=0.9999

由上面的结果可以看出,两个可靠性都为0.99的单元并联后,其可靠性提高到100倍,不可靠性由百分之一下降到万分之一。以此为基础就可以计算热备份连接的UPS系统的可靠性了。图2-10所示为热备份连接的UPS系统的可靠性模型图。其中,RB1RU1分别对应于热备份连接的UPS系统主机旁路的可靠性和主机的可靠性;RB2RU2分别对应于热备份连接的UPS系统备机旁路的可靠性和备机的可靠性。为了便于计算,仍设它们有着相同的可靠性,并都是0.99,则系统可靠性计算式为

图2-10 热备份连接的UPS系统的可靠性模型图

由上式可以看出,两台 UPS热备份连接的 UPS系统的可靠性比单台提高了两个数量级。

2.并联连接及其可靠性

两台UPS并联连接的原理图如图2-11所示。两台UPS并联连接的UPS系统的可靠性模型图如图2-12所示。根据上面的假设数据,其系统可靠性为

图2-11 两台UPS并联连接的原理图

图2-12 两台UPS并联连接的UPS系统的可靠性模型图

RP=1-(1-R1)(1-R1)=1-(1-0.9999)2=0.99999999

由上面的计算可以从理论上定性和定量地看出可靠性的趋势是

在冗余的情况下,系统的过载和耐冲击能力比热备份连接的UPS系统强;在非冗余的情况下,它的并联可以增容,这也是热备份连接技术所不能实现的。

(1)两台UPS1+1冗余并联

两台UPS1+1冗余并联供电系统的原理图如图2-13所示。所有负载容量之和小于单台UPS的容量,两台UPS的输出电压在输出配电柜内直接并联,然后再通过开关S0给负载供电。双电源负载就可以分别从两相电压上各引一路到负载,以满足双电源输入的条件,如图2-13中的S3、S4所示。

图2-13 两台UPS1+1冗余并联供电系统的原理图

(2)两台UPS1+1冗余并联供电系统的可靠性

在数据中心供电系统中的断路器,不论采用什么方式供电都是必不可少的,所以仅对供电系统中不同部分的可靠性进行分析。若两台UPS的可靠性R=0.99,则两台UPS1+1冗余并联供电系统的可靠性模型图如图2-14所示。此时,这个供电系统的可靠性R2

图2-14 两台UPS1+1冗余并联供电系统的可靠性模型图

R2=1-(1-r2=1-(1-0.99)2=0.9999

故障率α=lnR2=ln0.9999≈0.0001。不可靠性Q=1-R2=1-0.9999=0.0001。不可靠性是万分之一,故障率也大约是万分之一。也就是说,两台UPS冗余并联后,使系统的可靠性提高了两个数量级。其原因是使可用性表达式中的MTTR最小。

3.双总线UPS冗余供电方案的可靠性与可用性

(1)两台UPS输出端加一台DSTS系统

由于ATS具有转换时间长、寿命短、转换声音大和有火花干扰等缺点,为此推出了用晶闸管构成的电子式静态转换开关,以区别于机械式的自动转换开关。数字式静态转换开关(DigitalStaticTransferSwitch,DSTS)的转换时间小于4ms,它的转换方式是先断后合,允许两个电源在转换时的相位差大于180°。

DSTS的可靠性与电磁兼容指标等均应符合标准UL1008。DSTS的原理图如图2-15所示,DSTS的确能达到ATS所无法达到的一些性能。例如,DSTS的转换时间比ATS要快上一千多倍,而且没有声音,没有火花,对一般电子设备来说,在两个电源之间的转换间隔几乎是没有感觉的。由于DSTS对构成元器件质量的要求很高,并在多处都采用了冗余措施,所以造价也很高。两台UPS输出端加一台DSTS,比直接并联可靠性高,其系统原理图和可靠性模型图如图2-16所示。

图2-15 DSTS的原理图

图2-16 两台UPS输出端加一台DSTS系统的原理图和可靠性模型图

其工作原理是:两台UPS的输出端都连接到DSTS上,例如,开始由UPS1向负载供电, UPS2备用,一旦UPS1发生故障,DSTS就马上切断UPS1而接通UPS2,继续向负载供电,保证了负载设备的连续运行。但从两台UPS冗余并联的例子可以看出,即使不加DSTS也已经实现了在一台UPS发生故障的情况下负载连续运行下去的功能,而且还有双倍单机的过载能力,而这个能力已不存在。还不仅如此,这种结构的系统可靠性也有了变化,系统可靠性为

R总=1-(1-R)=1-(1-0.9922=0.9996

不可靠性Q=1-R总 =1-0.9996=0.0004。不可靠性是万分之四,是冗余并联时的4倍。而故障率α=1nR总=1n0.9996≈0.0004,也是冗余并联时的4倍。由此可以看出,原来1+1冗余并联的系统在增加了DSTS后,不但丧失了原来的强过载能力(一台UPS过载,切换后另一台也同样过载),其不可靠性或故障率也增大到原来的4倍。

为了提高包括服务器等电子设备的供电可靠性,用电设备本身对输入电源也作了冗余考虑,如采用双电源输入电路。双电源输入设备如图2-17所示。两路UPS交流电压分别输入到用电设备的两个输入端,该两个输入电路的输出端并联后为用电设备供电。

图2-17 双电源输入设备

(2)双总线UPS冗余供电方案

双总线UPS冗余供电方案如图2-18所示。在图2-18中,双总线的每一路都不是一台UPS,而是多台。目前的一般为8台UPS并联。如果采用8台UPS冗余并联就可以解决问题,那么最好不要采用双总线。尤其是在两台单机UPS就可以进行1+1冗余并联的时候,如果改用双总线方案,不但使设备量成倍增加,而且由于引入了串联功能的设备STS,而增加了故障点,投资还要远多于双倍1+1冗余并联。因STS要比同容量的UPS价格高,同时还失去了原来直接并联时过载能力强的优点,可靠性比原来也有所降低。

图2-18 双总线UPS冗余供电方案

4.两种供电方案的比较

设所有设备的可靠性R都是0.99,不考虑UPS以前和STS以后的这些公有的配电部分。两种供电方案,如图2-19所示。从可靠性的观点出发,凡是在该环节发生故障时都能导致系统不正常的情况都为串联环节,因此,图2-19(a)中的同步器LBS、STS和隔离变压器,在可靠性上同UPS都是串联关系。双总线供电方案的可靠性模型图如图2-20所示。由于两台UPS在STS的输出端对双电源负载是并联关系,由此得出系统的可靠性为

图2-19 两种供电方案

图2-20 双总线供电方案的可靠性模型图

RS=1-(1-R42=0.99845

不可靠性或故障率就是0.00155,即万分之十五。而两台UPS直接并联时的供电系统的不可靠性是万分之一。图2-19(a)所示方案再增加6台设备将使造价成倍增加,而可靠性则成10倍地降低。根据上面的计算,故障率是两台UPS直接并联时的15倍。

双交流输入可能是双市电,也可能是一路市电和一路备用发电机组。在这里以双路市电输入为例。双机冗余并联时一般是利用ATS将双市电互投为一路输出,如图2-21(a)所示。若以市电1为主电源,市电2为备用电源,则此时ATS通常就接通市电1到UPS。当市电1发生故障时, ATS就断开市电1而将市电2转接到UPS上。一旦ATS发生故障,就无法实现转接功能而使后面的所有UPS失去电源。这就是所谓的瓶颈效应,也有的称为单点故障。

图2-21 两种供电方案ATS的连接电原理图

如图2-21(b)所示的双ATS的连接法在正常情况下,ATS1将市电1接通到UPS1, ATS2将市电2接通到UPS2。如果由于某种原因导致市电1断电,那么ATS1就自动转换到市电2,以使UPS1的输入电源不间断,如果由于某种原因使得ATS1在市电1断电时无法实现转换,即使UPS1得不到市电2,那么仍然会处于无电源输入状态,只好待蓄电池放电终结后而关机。但由于STS1的存在,UPS2的输出电压会及时地经STS1转换到UPS1后面的负载上去,如图2-22所示。

图2-22 UPS1断电后UPS2经STS1将UPS2的输出接入路径图

由于此时UPS2的输入电压尚在正常供电,所以可使UPS1和UPS2的负载仍然不间断地工作下去。双总线的优点只有在这里才得以体现。不过,现在已处于无冗余供电状态,维修时间已成关键,为了改善这种状况,最好双总线的每一路都增加冗余,如都变成1+1,不过这时的设备量又成倍增加了。

另一方面,在双总线的情况下,双电源负载的两路输入电源是从两路引来的同相电源,即都是A相,或者都是B相,或者都是C相。当一路发生故障时,可以看出,此时双电源负载的两路输入电源是同一相,如果这时对应这一相的开关发生故障(接触不良或断开),那么该双电源负载就会因全部断电而停机。原来的目的是即使一个UPS后面的单电源负载全部断电,该双电源负载也不至于断电,而此时该目的就达不到了。

双总线作为冗余并联的补充措施在一定的场合下可显示出它的优越性,这种场合就是当容量与可靠性出现矛盾时。例如,一个数据中心的用电量是2500kVA,要求冗余并联后的供电系统的可靠性R总=0.99999,选定了某品牌单机容量为400kVA的UPS。为了方便分析,假设每台UPS的可靠性R相同,取R=0.99,目前UPS并联的台数不超过8,此处取8台并联,取7+1即可。这时400kVA×7=2800kVA,满足了2500kVA的需求,如图2-23(a)所示。可靠性R7+1可根据下式计算。

图2-23 同种负载情况下冗余并联与双总线系统的原理图

R7+1=1-(1-R7)(1-R)=1-(1-0.997)(1-0.99)=0.999021。

从结果看,不满足R总=0.99999的要求。如果采用6+2的方案,则

R6+2=1-(1-R6)(1-R2=1-(1-0.996)(1-0.99)2=0.999994

可靠性满足了要求,但容量只有400kVA×6=2400kVA,容量又不能满足要求了。如果用户的容量要求不可更改,只有采用双总线方案,如图2-23(b)所示。在双总线的情况下,系统的可靠性为

R8+8=1-(1-R7+12=0.99999922

此时可靠性满足要求,但设备量增加了一倍多,投资也成倍增加,损耗也显著增加,这就需要权衡利弊。不如采用 500kVA的 6+2方案更经济,而且容量为 500kVA ×6=3000kVA,富余很多,不但减少了投资,减小了损耗,也提高了系统的可靠性。这个例子说明,在很多情况下双总线并不是唯一的和最佳的解决方案。从前面的讨论也可看出,当容量与可靠性不发生矛盾时,采用双总线方案是不可取的。

即使在一个ATS发生故障而不能将另一路市电接入时,仍能保证全部负载不断电,从这个观点上说,可以将前面的两个 ATS更换成普通断路器。既然要求在任何一路市电或UPS发生故障时都要保证全部负载不断电,冗余并联的UPS就可以完全满足,所以UPS输出和负载之间除了必要的开关之外没有必要再增加STS。

几种双总线的结构方案如图2-24所示。图2-24(a)所示为双开关二机双总线结构。

图2-24 几种双总线的结构方案

它的特点在于每台UPS有两个输入开关,一个普通断路器和一个ATS。普通断路器供UPS主电路应用,ATS供两台UPS的旁路用电,这样一来从输入开关上就增加了一层冗余,即使其中一路市电发生故障断电,仍能保证双电源负载的双路供电。这里只用一个STS为单电源负载供电,与双UPS冗余并联相比,增加设备不多。如果采用分散小型STS结构方案,功耗和占地面积还可减小,价格还可降低。

当一路市电发生故障断电时,断电这一路UPS的输出就是通过ATS送过来的市电,这样一来,双电源负载的两个输入就有一路是市电,有可能引入干扰。为此可用第3台UPS来代替图2-24(a)中的市电,如图2-24(b)所示,此结构还具有串联热备份功能。

一个大的数据中心有大量的设备,但核心设备只是一部分而不是全部,即使是核心设备,其功率一般也不会很大(刀片服务器除外),这样一来就给供电方案的节能措施提供了方便。对于那些不是重点的设备可直接由双总线的一路电源供电,这样仅对那些重点设备的供电进行多重保护,就可节约相当大的一部分能量。

若某系统配置了600kVA×2作1+1冗余的UPS,本来作1+1冗余直接并联即可满足可靠性和容量要求,但在实际方案中却采用了如图2-25(a)所示的电路结构。

图2-25 大、小功率STS双总线供电方案比较

这里两台600kVA的UPS分成两路后分别送到5台60kVA容量的STS上,该5台STS各带自己的负载。开始由UPS1供电,一旦UPS1发生故障,STS就可以自动将UPS2切入来替换UPS1,以达到双电源冗余供电的目的。从前面的讨论可以看出,在这里可靠性与容量并未发生矛盾,两台UPS在容量上尚有极大的空间。如果不直接冗余并联首先就丢失了双倍过载能力的优点,直接隐患是多了一个故障点。

以满负荷为例,首先计算出UPS的输出电流I=600kVA/220V=2727A,静态开关由晶闸管构成,导通压降设为U=1.5V,于是在这些晶闸管上的消耗功率是

P=I×U=2727A×1.5V≈4091W

每年消耗能量为

Q=4091W ×8765h≈35857kWh=35857度

也就是说,每年仅STS就消耗掉35857度电能,如果采用如图2-25(b)所示的电路结构方案,就可将这些功率节约下来。假设每台60kVA的STS价格为50万元人民币,5台就是250万元。采用如图2-24(b)所示的电路结构方案后,每台MSTS仅3000元,可节约投资。