故障定位时要遵循定位的基本原则。
故障定位关键是:将故障点准确地定位到单站。
故障定位的一般原则可总结为四句话:先外部,后传输;先网络,后网元;先高速,后低速;先高级,后低级。
故障定位的一般原则可总结如下:
先定位外部,后定位传输。
在定位故障时,应先排除外部的可能因素,如光纤断,对接设备故障或电源问题等。
先定位网络,后定位网元。
在定位故障时,首先要尽可能准确地定位出是哪个站的问题。
先排除高速部分,后排除低速部分。
从告警信号流中可以看出,高速信号的告警常常会引起低速信号的告警;因此在故障定位时,应先排除高速部分的故障。
先分析高级别告警,后分析低级别告警。
在分析告警时,应首先分析高级别的告警,如紧急告警、主要告警;然后再分析低级别的告警,如次要告警和提示告警。
2、故障判断与定位的常用方法
故障定位的常用方法可简单地总结为:一分析,二环回,三换板。
当故障发生时,首先通过对告警、性能事件、业务流向的分析,初步判断故障点范围。然后,通过逐段环回,排除外部故障或将故障定位到单个网元,以至单板。最后,更换引起故障的单板,排除故障。
对于较复杂的故障,需要综合下图方法进行故障定位和处理。
常用方法 | 适用范围 | 操作特点 |
告警、性能分析 | 通用 | 把握全网信息 初步定位故障点 不影响正常业务 依赖于网管 |
环回法 | 分离外部故障,将故障定位到单站、单板 | 不依赖于告警、性能事件的分析 快捷有效 |
替换法 | 将故障定位到单板,或分离外部故障 | 简单 对备件有需求 需要与其它方法同时使用 |
配置数据分析法 | 将故障定位到单站或单板 | 可查清故障原因 定位时间长 依赖于网管 |
更改配置法 | 将故障定位到单板 | 风险高 依赖于网管 |
仪表测试法 | 分离外部故障,解决对接问题 | 通用,具有说服力,准确度高 对仪表有需求 需要与其它方法 |
经验处理法 | 特殊情况 | 处理快速 易误判 需经验积累 |