案例20 OSN 1500B电源板温度过高上报POWER_ABNORMAL告警
故障现象
某铁路局,A站点OSN 1500B设备两块电源板上报POWER_ABNORMAL告警,设备运行正常,联系现场人员到机房查看电源板两路供电正常,该设备无其他异常告警。
组网情况
A站点处于一个二纤单向通道环中。
原因分析
OSNV1R3及其以后版本的POWER_ABNORMAL告警参数统一定义如下:
para[0]通道号(表示电压类型或者告警类型)
1.48V电压
2.5V电压
3.3.6V电压
4.3.3V电压
5.3.3V备份电压
6.3V电压
7.2.5V电压
8.1.8V电压
9.1.6V电压
10.1.5V电压
11.1.2V电压
12.-5V电压
13.防雷电告警
14.3.3VBakin电压
15.扩展子架电源告警
para[1]0(固定值)
para[2]1(固定值)
para[3]过压欠压指示
一般情况下0表示欠压,1表示过压;当para[0]=13或者15时,para[3]无意义,只由para[0]表示电源异常的类型。
para[4]0×ff(保留值,无意义)
A站点OSN 1500B网元主控板软件版本为:5.36.18.50,POWER_ABNORMAL告警参数为:0×00,0×01,0×00,0×01,0×ff,告警参数指示为-48V电源欠压,怀疑为电源电压输入过低引起的故障。
故障定位及处理过程
1.前面分析怀疑为A网元电源电压输入故障,通知现场人员用万用表测试电压,电压值为-53.6V,在正常范围内;
2.怀疑为AUX板故障,引起电源板异常上报电源告警,现场物理复位AUX,待单板正常运行后,告警不消失;
3.在排查故障中,现场反馈机房温度比较高,OSN 1500B设备比较烫手,怀疑是否由温度过高引起,询问得知机房的空调制冷能力不行,机房已经长期处在高温状态;
4.现场清理防尘网,将设备机柜的前后门打开,等设备温度下降后,POWER_ABNORMAL告警消失,关闭机柜门离开现场,在第二天早上网管重新上报POWER_ABNORMAL告警,设备降温后,故障再次消除。
总结和建议
1.应避免设备长期处于高温环境,保持机房环境温度在20℃~30℃、相对湿度在30%~70%之间,可以有效地延长设备使用寿命、降低器件自然失效的几率;
2.定期对防尘网进行清理,建议每月清理一次。