案例51 复用段倒换后不能恢复故障处理
故障现象
1.车站2套OSN 3500、站间6套OSN 2500组成8点环形复用段,3225-3226网元之间发生复用段倒换,业务正常倒换;
2.网管查询告警和性能:OSN 2500交叉板上报APS_INDI、MS_APS_INDI_EX告警;网元未检测到SF、SD事件,网元间ECC正常,倒换不能恢复;
3.设备主机版本:5.36.18.50P01。
组网情况
组网如图1-30所示。
图 1-30
原因分析
1.自愈保护参数不正确;
2.光路故障;
3.复用段协议异常;
4.单板故障。
故障定位及处理过程
1.检查全环业务、协议、节点参数等配置,正常;
2.检查3225、3226之间无异常告警,检查告警屏蔽状态,所有能触发MSP倒换的告警均没有屏蔽,相应光板的收光光功率均在正常接收范围内,设备性能也未发现异常,网管ECC正常可达;
3.命令查询K字节事件“:cfg-get-rmsevent:1”,如图1-31所示;
4.通过K字节事件,发现3226网元检测到BD_OFFLINE事件后,西向短径/东向长径发送“信号失效环倒换(SF_R)”请求“0×b120/0×b128”;3225东向收到3226西向短径发来的“0×b120”倒换请求后,西向长径/东向短径发送“信号失效环倒换(SF_R)”请求“0×b218/0×1210”;后续网元正常切换交叉页面,K字节发送接收都正常;
5.K字节事件里面未发现“SF_CLEARS、T2_START”事件,且3226网元倒换后,又上报一次“BD_OFFLINE”事件,两网元的K字节事件未变化,协议认为该方向没有收到K字节,倒换不恢复,无法进入WTR状态;
6.关闭打开3225发3226网元的激光器后,查询发现3226网元正常启动T2定时器,查询复用段进入WTR,10min后倒换恢复;
图 1-31
7.倒换恢复2天后,3226网元9槽位主控交叉光口合一板上报HARD_BAD,后更换该单板,业务正常。
总结和建议
1.一般引起复用段倒换的告警有R_LOS、R_LOF、B2_EXC、MS_AIS等,如果复用段倒换时并没有这些告警,则很可能是交叉板检测到线路板不在位,这种情况下可能是线路板故障,也可能是交叉板故障,需具体问题具体分析;
2.出现复用段不恢复的情况,要学会利用命令查询K字节事件来分析,可以利用关闭激光器来重新触发一次故障区段的K字节事件,来帮助处理故障。