significado alarmas de sdh

14
Resolución de alarmas de SDH Alcatel: ALARMAS DE PATH CLIENT FAILURE Esta alarma se dispara sobre el Path cuando en alguno de los extremos donde se baja en unpuerto eléctrico hay un LOS. BANDWIDTH REDUCED La alarma se dispara cuando en un Path Ethernet, alguno de los VC12 que componen el Pathfalla pero no todos, por lo cual el ancho de banda de la Ethernet se reduce. Puede que eseVC12 no haya conmutado ante un problema, se puede forzar. TRANSPORT FAILURE La alarma se dispara sobre el Path cuando en alguna parte del mismo existe una alarmaafectando el tráfico como puede ser RDI, AIS, etc, tanto en el main como en el spare, es decirel servicio está completamente caído. Se debe identificar y solucionar la alarma que estáafectando el tráfico. TRANSPORT INCOMING FAILURE La alarma se dispara sobre el Path cuando en alguna parte del mismo existe una alarmaafectando el tráfico entrante como puede ser Remote Defect Indication Ingr, o Server SignalFailure Ingr, etc, tanto en el main como en el spare, es decir el servicio está completamentecaído. Se debe identificar y solucionar la alarma que está afectando el tráfico. SERVER SIGNAL FAILURE La alarma se dispara sobre el Path cuando el tráfico del mismo está afectado por una alarmaen algún punto de mayor grado (VC3, VC4,

Upload: nacho-veltran

Post on 24-Apr-2015

202 views

Category:

Documents


6 download

TRANSCRIPT

Page 1: Significado Alarmas de Sdh

Resolución de alarmas de SDH

Alcatel: ALARMAS DE PATH

CLIENT FAILURE

Esta alarma se dispara sobre el Path cuando en alguno de los extremos donde se baja en unpuerto eléctrico hay un LOS.

BANDWIDTH REDUCED

La alarma se dispara cuando en un Path Ethernet, alguno de los VC12 que componen el Pathfalla pero no todos, por lo cual el ancho de banda de la Ethernet se reduce. Puede que eseVC12 no haya conmutado ante un problema, se puede forzar.

TRANSPORT FAILURE

La alarma se dispara sobre el Path cuando en alguna parte del mismo existe una alarmaafectando el tráfico como puede ser RDI, AIS, etc, tanto en el main como en el spare, es decirel servicio está completamente caído. Se debe identificar y solucionar la alarma que estáafectando el tráfico.

TRANSPORT INCOMING FAILURE

La alarma se dispara sobre el Path cuando en alguna parte del mismo existe una alarmaafectando el tráfico entrante como puede ser Remote Defect Indication Ingr, o Server SignalFailure Ingr, etc, tanto en el main como en el spare, es decir el servicio está completamentecaído. Se debe identificar y solucionar la alarma que está afectando el tráfico.

SERVER SIGNAL FAILURE

La alarma se dispara sobre el Path cuando el tráfico del mismo está afectado por una alarmaen algún punto de mayor grado (VC3, VC4, etc). Hay que verificar desde el routing displaydonde se presenta esa alarma que afecta el tráfico y resolverla.  DEGRADED PROTECTION

La alarma se dispara cuando alguno de los caminos MAIN o SPARE del Path, esta caído enalgún punto del trayecto. No afecta el tráfico ya que la transmisión se continúa realizando porel camino que está arriba.

Page 2: Significado Alarmas de Sdh

ALARMAS DE PUERTO

LOS

Loss of SignalLa alarma se dispara cuando el puerto (sea óptico o eléctrico) deja de recibir señal a través delcableado. Puede ser porque el cableado se rompió, porque el equipo en el otro extremo delcableado está apagado. Siempre es un problema físico.Descartar con Loop físico si se trata del cableado, del puerto de Alcatel o del equipo delcliente.

AIS

Alarm indication signalLa alarma se dispara cuando ocurre un LOS o un AIS en algún punto del trayecto del Path. Sedebe rastrear el origen, con Loops lógicos y observando detalladamente el Routing Display delPath. El AIS puede provenir también de una frontera que no está dando contra nada, osimplemente de una frontera que arrastra un AIS a su vez desde Nortel o Huawei.

RDI

Remote Defect indicationLa alarma se dispara cuando hay algún problema en la recepción del otro extremo. Se debeverificar la otra punta del circuito donde probablemente exista un LOS o un AIS en larecepción.

LOF

Loss of frameLa alarma se dispara cuando los bytes A1 y A2 en el overhead llegan con patrones corruptos.Esto indica que los frames no se están recibiendo correctamente. Puede deberse a error de configuración (por ejemplo diferencia en la canalización). Se debe aislar la falla con Loopslógicos.También se puede probar borrando el Path y volviéndolo a crear (solo si no hay ningún equipocaído en el trayecto del Path).

UN EQUIPPED

La alarma se dispara cuando falta la crossconexion en el equipo, puede ser la crossconexion enel puerto donde baja el servicio o una crossconexion entre KLM en algún puerto intermedio ofrontera. Si verificamos que no hay ningún equipo caído en todo el trayecto del trail, podemosborrar y volver a crear el Path, lo que volverá a crear todas las crossconexiones en los equiposy clareara la alarma.

TIM

Trace identifier Mismatch

La alarma se dispara cuando el byte J1 que se recibe del equipo vecino no se corresponde conlo que se espera recibir. Esto puede pasar porque o bien se desinserto el equipo vecino con locual recibimos el byte J1 correspondiente al equipo siguiente, o bien porque está malconfigurado el byte J1 en el equipo vecino. Configurando correctamente el byte J1 en el equipovecino o bien cambiando en el

Page 3: Significado Alarmas de Sdh

equipo alarmado lo que se espera recibir clarea la alarma.El byte J1 se utiliza para comunicar al equipo vecino en un anillo un texto pequeño, porejemplo acrónimo y puerto de fibra. De esta manera en caso de una desinsercion o unainversión de las fibras, se disparara la alarma, ya que no recibimos lo que se esperaba recibir.

SERVER SIGNAL FAILURE INGR

La alarma se dispara cuando hay otra alarma a un nivel mas grande (VC3,VC4) que afecta eltrafico es nuestro VC12. El INGR , indica además que el trafico afectado es el que se estárecibiendo en KLM en particular. Esto puede indicar que alguna STM-1 o más grande estacaída, en algún punto del Path a partir de donde se recibe esta alarma. Si la alarma se recibeen una frontera, esto indica que la falla se encuentra del otro lado de la frontera.Como siempre, se debe probar con Loops y creando trails frontera más cortos para irachicando y aislando la falla.

COMMUNICATIONS SUBSYSTEM FAILURE

La alarma se dispara sobre el puerto STM-n del equipo e indica que hay problemas de gestióncontra el equipo vecino. Generalmente puede estar mal el LAPD en el equipo vecino o ennuestro equipo. Se puede probar cambiando el LAPD en nuestro equipo y ver si clarea laalarma. También puede darse una falla en la controladora del equipo vecino. Se debedescartar enviando técnico al equipo vecino para que se conecte por Local Craft y verifiquecomo está configurado el LAPD.

REMOTE DEFECT IND ICATION INGR

La alarma se dispara cuando se detecta en el KLM donde se presenta la alarma problemas en elcamino de recepción del equipo remoto, generalmente se da sobre una frontera. ColocandoLoops intermedios se puede aislar donde está la falla.

MIB BACKUP MISALIGNEDLa alarma se dispara cuando el equipo no logra hacer el backup de su config al servidor deAlcatel. Se puede realizar manualmente el backup, pero la alarma no afecta en nada losservicios 

HUAWEI:

T_ALOS:Tributary loss of signal

La alarma se dispara cuando el puerto eléctrico deja de recibir señal a través del cableado.Puede ser porque el cableado se rompió, porque el equipo en el otro extremo del cableadoestá apagado. Siempre es un problema físico.Descartar con Loop físico si se trata del cableado, del puerto de Huawei o del equipo delcliente.

Page 4: Significado Alarmas de Sdh

DOWN_E1_AIS/UP_E1_AIS:2M port Alarm Indication Signal

La alarma se dispara cuando ocurre un LOS o un AIS en algún punto de la red que conecta alpuerto eléctrico donde vemos la alarma. Si el puerto da al cliente, el cliente debería revisar sured, podemos además ponerle un Loop al cliente para que vea que no le cierra ya que algo ensu red está fallando.

TU_AIS:Tributary Unit Alarm Indication Signal

La alarma se dispara cuando ocurre un LOS o un AIS en algún punto del trayecto del Trail. Sedebe rastrear el origen, con Loops lógicos y observando donde clarea la alarma y donde no. El AIS puede provenir también de una frontera que no está dando contra nada, o simplementede una frontera que arrastra un AIS a su vez desde Nortel o Alcatel. Esta alarma indica que lafalla esta en nuestra red.

PS: Protection Switching

La alarma se dispara cuando ocurre un switcheo del camino del trail, o paso a Spare o estabaen Spare y paso a Main. La alarma puede persistir por un tiempo, pero aunque sea una alarmamayor no afecta el tráfico, es solo indicativa de que hubo un switcheo.

ETH_LOS Ethernet Port Loss of Signal

La alarma se dispara cuando no hay link en el puerto Ethernet del equipo Metro. Se debeverificar cable y equipo del cliente. Se puede probar también pasar el servicio a otro puerto.

R_LOS Loss of signal

La alarma se dispara cuando se detecta la falta de señal en el puerto óptico. Puede deberse acorte de fibra, falla en el modulo transmisor del equipo enfrentado, o que se haya apagado ellaser del otro equipo desde la configuración.

HP_TIM High order Path Trace identifier Mismatch

La alarma se dispara cuando el byte J1 que se recibe del equipo vecino no se corresponde conlo que se espera recibir. Esto puede indicar que el equipo vecino fue desinsertado, o que lasfibras están invertidas. La alarma no afecta tráfico, es solamente indicativa.

J0_MM J0 byte Mismatch

Análogo a la alarma de HP_TIM, pero en vez del byte J1, es con el byte J0.

Page 5: Significado Alarmas de Sdh

  S1_SYN_CHANGE Clock source switching

La alarma se dispara cuando por algún problema el equipo debe switchear el source por el quetoma Clock. El switcheo puede deberse a que cayó la cara del anillo por la cual obtenía elClock. Verificar que el Clock haya conmutado correctamente, sino se deberá forzar.

LTI Loss of synchronous source

La alarma se dispara cuando se pierden ambas caras por las cuales se obtiene el Clock de lared. El equipo pasara a generar el mismo el Clock. Se debe verificar porque no funcionaninguna de las dos caras.

BIP_EXC Bip errors excess

La alarma se dispara cuando la cantidad de errores sobre el puerto óptico sobrepasa un limitepreconfigurado. Se debe descartar suciedad en los patchcords en ambos extremos de la fibra,reemplazar módulos ópticos y medir potencia de la fibra.

TU_LOP_VC12VC12 Tributary unit loss of pointer La alarma se dispara al detectar la falta o la falla del puntero de la trama sobre un VC12. Laalarma se visualiza sobre un puerto óptico pero se refiere a una sola VC12 dentro de la STM1.El loss of pointer puede provenir por un Path colgado o alguna falla de puerto. Con Loopslógicos se debe aislar donde se produce el loss of pointer. También se puede probar borrandoel trail y volviéndolo a crear.

TU_AIS_VC12VC12 Tributary unit Alarm Indication signal

La alarma se dispara cuando ocurre un LOS o un AIS en algún punto del trayecto del Trail VC12.Se debe rastrear el origen, con Loops lógicos y observando donde clarea la alarma y donde no. Esta alarma se dispara en el caso particular de puertos ópticos y de puertos Ethernet, indicaque solo esa VC12 está afectada, y se debe buscar que trail corresponde a esa VC12 paraseguir haciendo pruebas y poder rastrear el punto de falla. Esta alarma indica que la falla estaen nuestra red.

LOOP_ALMLoopback alarm La alarma se dispara cuando hay colocado un Loop en el puerto. 

Page 6: Significado Alarmas de Sdh

LP_REILower order Path Remote Error Indication

La alarma se dispara cuando se detectan errores en la recepción del otro extremo. Se debeverificar si no hay alarmas de BIP errors en el otro extremo y realizar una medición con BERT yLoops para detectar donde se están generando (puede ser un patchcord sucio en el cliente, lafibra, o los módulos de fibra).

LP_RDILower order Path Remote Defect Indication

La alarma se dispara cuando hay algún problema en la recepción del otro extremo. Se debeverificar la otra punta del circuito donde probablemente exista un LOS o un AIS en larecepción.

LP_UNEQ Lower order Path Unequipped

La alarma se dispara cuando falta o falla la crossconexion en el equipo correspondiente alpuerto donde se presenta la misma. Se debe verificar si la crossconexion existe y si existe sepuede probar borrar el Trail y volver a crearlo.

ALM_ALSAutomatic Laser Shutdown

La alarma se dispara cuando el equipo apaga automáticamente uno de los laser. No es unaalarma común ya que sobre los equipos de Huawei no se configura el apagado automático. El laser se apaga de forma automática ya que existe un problema (LOS, RDI) en puerto, ysuperado cierto tiempo en que está presente la alarma se apaga el laser.Puede volver a encenderse el laser de forma manual desde la configuración del equipo. 

FAN_FAILFan Failure

La alarma se dispara cuando se detecta un problema en alguno de los Cooler del equipo. Estopodría generar un recalentamiento del equipo y que empiece a fallar. Se debe coordinar ATpara verificar si el cooler está muy sucio y reemplazarlo.

IN_PWR_ABNInput power abnormal

La alarma indica que la potencia óptica que se recibe de la fibra es anormal. Esto puede serporque el patchcord o la fibra estén muy dobladas, que el transmisor del equipo vecino estefallando o que el receptor de equipo donde está la alarma este fallando. Se puede loopear lafibra físicamente y ver si clarea la alarma, realizar medición de potencia para asegurarse quelos valores son óptimos.

Page 7: Significado Alarmas de Sdh

POWER_FAILInput Power voltage failure

La alarma se dispara cuando se pierde tensión eléctrica del equipo y comienza a funcionar através de las baterías. Puede ser por corte de energía del cliente o que se haya apagado elequipo. Como el equipo empieza a funcionar con las baterías, sabemos que aprox. 2 o 3 horasluego de esta alarma el equipo va a caer completamente produciendo una apertura de anillo.Se debe ver con el cliente si esta encendido el equipo o desenchufado, y en último de los casosenviar AT a cambiar la fuente del mismo.

PWR_MAJ_ALMAbnormal voltaje

La alarma se dispara cuando detecta una anomalía en la tensión eléctrica que recibe el equipo.Puede ser que reciba mayor voltaje o menor.Se debe verificar puesta a tierra y el origen de donde recibe tensión, también cambiar fuentedel equipo.  SYN_BADSynchronous source degraded

La alarma se dispara cuando existe un problema con el clock que se está obteniendo de algunade las fibras. Se debe probar forzar el clock por la otra fibra, y si el problema continua puedeser que la placa de clock del equipo este fallando. Probar también hacer un Cold Restart sobrela placa de clock, como último recurso reemplazar equipo.Que el source del clock este degradado puede generar bit errors sobre los servicios.

 LFALoss of Frame Alignment La alarma se dispara cuando detecta en los frames que le van llegando al tributario unapérdida o corrupción de los bytes de alineación de trama. Puede darse que el Path estecolgado (borrar y recrear), o que exista degradación en el camino (crear Path de medición).Si el Path pasa por una placa Nx64 que canaliza podría ser un problema de configuración detimeslots. Verificar con Loops y aislar la falla.

Nortel:

PPI-Unexp_Signal

La alarma se presenta sobre puertos que están físicamente conectados (reciben señaleléctrica) pero no tienen ningún trail configurado. Si se supone que en ese puerto deba existirun servicio se deberá crear el trail sobre el mismo.

Page 8: Significado Alarmas de Sdh

PPI-LOS

La alarma indica ausencia de señal en el puerto, se debe verificar cableado, equipo conectado,etc con Loop físico.

 PPI-AIS

La alarma indica que en algún punto del trail existe una alarma de LOS o de AIS. Se deberastrear el origen de la falla colocando Loops y verificando donde clarea la alarma y donde no.Si el trail hace frontera se debe verificar que ambas tecnologías estén pasando el servicio porel mismo J y el mismo KLM. Colocando un Local Loop en el puerto donde sepresenta la alarmase descarta si la alarma viene del cliente o de nuestra red.

TU-AIS

Idéntica al PPI-AIS solo que se presenta sobre un KLM y no sobre un tributario.

PPI-TF

La alarma se dispara cuando la señal saliente del puerto cae por debajo de un valorpredefinido. Puede haber una falla en el cableado o puede estar fallando el puerto del equipo.Se debe verificar físicamente.

SYNC-Source_Fail

La alarma se dispara cuando falla el sincronismo sobre la pata en la que se presenta la alarma.Se deberá verificar si no existen alarmas o degradación sobre esa pata, y reconfigurar elsincronismo para que salga por la otra pata.

 RS-LOS

La alarma se presenta cuando hay ausencia de señal sobre un puerto STM-1 o mayor. Puedeser corte de fibra, equipo vecino apagado, o modulo óptico fallado.

LP_SF

La alarma se presenta cuando fallan ambos caminos (Main y Spare) en un trail protegido.Análogo al caso de Transport Failure en Alcatel.Se debe verificar los puntos en común de ambos caminos Main y Spare.

OS-Laser_Shutdown

La alarma se dispara cuando el NE apaga automáticamente el Laser por detectar algúnproblema óptico (LOS o RDI) y por tener configurado el ALS (Automatic Laser Shutdown).

Page 9: Significado Alarmas de Sdh

Qecc-Comms_Fail

La alarma se dispara cuando se pierde comunicación del canal de gestión contra el equipovecino en esa pata.

 TU_LOP

La alarma se dispara al detectar un puntero de trama incorrecto. Se presenta específicamentesobre un KLM, no sobre un puerto eléctrico. Puede ser que el trail se haya colgado, que estefallando el puerto o la placa STM-n (si vemos mas alarmas de TU_LOP sobre otros servicios).Se puede aislar de donde proviene la falla con Loops lógicos donde puedan colocarse. Probarantes de encarar un procedimiento de reinicio de placa borrar el trail y volver a crearlo.

PPI-DEG

La alarma indica degradación en la señal del puerto, se detectan errores de código HDB3.Puede ser cableado defectuoso, puerto o equipo del cliente.Con un Loop físico se puede confirmar exactamente de donde provienen los errores.   PPI-EXC

Cuando hay presente una alarma de PPI-DEG, y la cantidad de errores por segundo excede unvalor predefinido, se dispara la alarma de PPI-EXC. Se debe proceder como con la alarma dePPI-DEG.

 LP-UNEQ La alarma indica que no se encuentra la crossconexion en el tributario del equipo. Puede serque por algún motivo se haya borrado o que este colgado, o que este fallando el puerto.Borrar y volver a crear el trail, creara todas la crossconexiones necesarias para que el serviciopase de punta a punta. Si la alarma continua un reinicio de placa podría ser necesario.

LP-TIM

La alarma es análoga a la alarma de HP_TIM en Huawei. Esto indica que el byte de la tramausado para recibir información sobre qué equipo vecino es el que tenemos conectado en esapata, no está coincidiendo con el valor que se espera recibir. Esto puede indicar un equipovecino desinsertado o con las patas de fibra invertidas.

LP-REI

La alarma indica que el equipo en el otro extremo del puerto, está recibiendo errores de partede nuestro equipo y nos avisa de eso enviándonos una alarma de REI. Debemos verificarcableado, fibra, puerto y modulo de transmisión de nuestro equipo, y puerto/modulo derecepción del equipo del otro extremo.

Page 10: Significado Alarmas de Sdh

LP_RDI

La alarma indica que lo que le estamos transmitiendo al equipo en el otro extremo delcableado/fibra está llegando mal. Puede ser el modulo de transmisión óptico/puerto eléctricode nuestro equipo, puede ser el cableado/pelo de fibra de transmisión o puede ser elpuerto/modulo de recepción óptico del equipo del otro extremo.Se debe verificar con Loop físico para aislar la falla.

LP_DEGIgual que la alarma de PPI-DEG, pero los errores provienen de nuestra red.

LP_EXCIgual que PPI-EXC pero los errores provienen de nuestra red. 

Martis:

Frame far-end alarm

La alarma indica que en el extremo opuesto del trail, existe un Loss of Frame. Se debe verificarsi la canalización es igual en ambos extremos, y si ambas interfaces están configuradas con osin CRC, configuración de CAS, etc. Debe estar todo igual en ambos extremos.

AIS

La alarma indica que en algún punto de la red o de la red del cliente, existe un LOS o un AIS.Se debe verificar con Loops lógicos donde clarea la alarma y donde no, para aislar la falla.

Excessive BER

La alarma indica que la cantidad de errores es excesiva. Se debe verificar cableado, con Loopfísico para confirmar el punto que origina los errores.

Rx signal missing

Es un LOS, no se recibe ninguna señal del equipo conectado. Puede ser cableado o equipoconectado apagado.

BER10E-3

La alarma indica una determinada cantidad de errores detectados. Se debe verificar el puntoque origina los errores con Loops