华为MSTP以太网业务中止问题定位
和SDH故障定位思绪一样,以太网故障定位也遵照“先外部、再内部;先软件、再硬件;先单板、再系统”标准,充足利用性能事件、环回、测试帧等技术手段,结合工具软件、测试仪表进行有计划有步骤定位。
和SDH定位不一样是,以太网本身缺乏网络管理、监控能力,即OAM功效很弱,这种劣势往往需要更多使用工具软件和仪表来填补。同时,故障往往牵涉传输和数通两大产品,这就要求维护人员能站在整个网络高度、业务角度来看待问题,而不是仅仅看到SDH网络。下面简单介绍部分华为MSTP业务在运行中忽然中止情况下应急处理步骤: 1、首先在网管上检验有没有以下异常告警:
告警名称 | 告警说明 | 操作 |
TU_AIS(_VC12) | 支路信号失效 | MSTP 设备SDH 侧故障, 需深入定位SDH 侧问题 |
TU_LOP(_VC12) | 支路指针丢失 | MSTP 设备SDH 侧故障, 需深入定位SDH 侧问题 |
LP_RDI(_VC12) | 支路信号远端失效 | MSTP 设备SDH 侧故障, 需深入定位SDH 侧问题 |
BIP_SD/BIP_OVER | 支路信号误码过量 | MSTP 设备SDH 侧故障, 需深入定位SDH 侧问题 |
BD_STATUS | 单板不在位 | 更换单板或主控板 |
HARD-BAD | 单板硬件故障 | 更换单板 |
SYN-BAD | 时钟同时源劣化 | 更换本站或其它站时钟板; 或开启主备倒换; 或更换外时钟源。 |
FAN_FAIL | 风扇故障导会致设备温度高, 影响正常运行 | 检验风扇开关是否开启; 或更换风扇 |
另外,经过观察电路板指示灯闪烁情况,能够初步判定故障原因并做对应处理,以下表所表示:
灯状态 | 常见原因 | 操作 |
电路板红、绿灯灭 | 该板或时钟板有故障 | 换该板或时钟板 |
电路板红、绿灯长亮 | 该板自检失败或时钟板有故障 | 换该板或时钟板 |
板绿灯每4 秒闪烁1 次 | 该板脱机或处于复位状态 | 重新拔插该板, 换该板、换SCC 板 |
某板绿灯每1 秒闪烁5 次 | 配置数据丢失 | 重下配置数据 |
某网元全部支路板、线路板和交叉板红灯均每1 秒闪烁3 次 | 时钟板故障 | 换时钟板 |
从以上告警检验和设备指示灯能够首先判定设备SDH是否发生乐问题,假如出现上述现象,请根据SDH设备故障处理方法进行处理。
2、检验以太网单板有没有以下异常告警:
告警名称 | 告警说明 | 操作 |
ETH_LOS | 以太网连接丢失 | 以太网双绞线故障或对端数据设备故障, 可更换定位 |
inbadoctsover | 接收到坏包字节数高于上界告警 | 更改单板工作模式(速率/双工)使之和对接设备相同 |
fcserrorover | FCS校验犯错告警 | 更改单板工作模式(速率/双工)使之和对接设备相同 |
假如出现ETH_LOS告警,说明传输设备以太网板和数据设备对接之间出现问题,可能是(1)断纤; (2)以太网线干扰太大; (3)以太网口失效(接口板故障);(4)以太网双绞线断;(5)PHY芯片损坏;(6)两端工作模式不匹配。能够经过更换网线,更换端口等方法进行简单定位处理。
另外,确定一下ET1单板插网线以太网接口是否有LINK灯亮(绿色),没有亮说明网线可能坏了,或是交叉和公网线弄混了。(注意光接口板指示灯在接口板内部);同时看看接口上另外一个指示灯(黄色)是否在亮,有亮说明有数据收发,没有则说明无数据收发。
3、假如仅仅是丢包问题,还能够结合以太网性能事件进行判定。假如是以太网中止问题,请根据下面步骤继续处理。
4、假如经过检验,没有发觉上述告警信息,请检验以太网业务基础配置。正常情况下业务忽然中止不会有以下原因造成,单假如存在人为误操作或部分单板故障,需要查
询该项。
a)查询以太网口使能和工作模式。
在主菜单中选择[配置/以太网配置/以太网接口/以太网接口]。
从左下角选择操作对象(以太网单板),然后在界面右边进行对应属性设置(下同)。注
意端口工作模式要和对端设备保持一致,比如10-100M或1000M全双工和自适应对接。
B)查询MP(VCTRUNK)通道2M绑定定义,确定两端绑定业务颗粒大小数量相同。
C)查询端口默认VLANID。假如ip端口设置了untag(或access)属性不过配置了vlan路
由业务类型,那么该ip端口默认vlanid一定要和vlan路由中vlanid 一致,不然话,这个小疏忽却能使业务中止。查询方法同时骤A)。
(静态路由查询)
5、经过第4步检验,可基础排除配置问题,假如业务仍然不通,提议采取测试帧功效进行测试。经过在一端单板发送测试帧,和收到对端单板发回应答帧比较,判定VCTRUNK通道是否存在异常。ET1系列单板需要使用命令行进行验证,而EFGS系列单板能够在网管上测试。
在主菜单中选择[配置/以太网配置/以太网测试],从左下角选择操作对象(以太网单板)然后在界面右边进行测试,假如发送测试帧和收到应答帧完全相同,能够确定传输 。VCTRUNK通道没有问题(隐含SDH侧没有任何问题)
测试时选择单板在菜单下选择以太网板,测试以下图选择(发送模式—continue模式)
6、假如做完上面几步,数据维护人员仍然认为MSTP问题造成业务不通,我们能够在MSTP两端设备端口直接经过网线和PC相连(前提是MAC端口不是TAG属性)相互PING测试。假如两台计算机能够相互ping通,即可完全排除传输设备本身问题,那么只有数据设备故障或对接原因了。
7、采取仪表测试也是一个比较根本方法。
现在大部分模块局和大用户单位全部安装了MSAP设备,类型有瑞士康达、高科,在业务开通时和SDH设备对接开通电路时应注意部分细节,现就华为MSTP以太网和MSAP业务开通时要注意现象简单描述下:
1、业务开通以太网电路制做和SDH没有区分,但AP和TP在对接时开销字节不匹配会造成业务不通.以华为OSN1500设备N2EGS2千兆以太网板为列。告警故障图:
故障提醒-VC12等级低阶通道追踪识别符失配。图点击应发或应收右键在下拉菜单里选择
修改追踪字节J2:
以下是和高科MSAP对接进行业务开通时在以太网设置VC12通道开销J2字节:
这是和瑞士康达MSAP对接开通业务显示J2字节。
高科和瑞士康达MSAP字节开销信号标志设备设置(应发V5和应收V5)图:
2、查看以太网SDH电路路径。
以下图为列:业务端口Vctrunk1,绑定通道VC4-4-VC12(2)绑定了一个VC12
在业务配置—SDH业务配置找到该电路时隙,选中右键选择浏览相关路径
-下图是该电路源网元和宿网元具体资料