medidas para la activación y puesta en servicio y monitorización de circuitos ethernet
TRANSCRIPT
RFC2544/Y.1564 – Y.1731/TWAMP
Medidas para la activación y puesta en servicio y monitorización de circuitos
Ethernet
Noviembre 2016
José R. Salvador
RFC2544/Y.1564 – Y.1731/TWAMP 2
Indice
• Medidas para activación y puesta en servicio (EtherSAM)
• Intrusivas
• RFC2544
• Y.1564
• Medidas para la monitorización de enlaces Ethernet (KPI vs
SLA)
• No intrusivas
• Y.1731 (L2)
• TWAMP (L3)
RFC2544/Y.1564 – Y.1731/TWAMP 3
Inconvenientes RFC2544
• Pensada para entorno de laboratorio pero no en campo real
• Pensada para una conexión punto a punto (mide la capacidad
máxima de un link), pero no para un servicio ‘end-to-end’ con
múltiples enlaces ni velocidades inferiores al caudal máximo
del enlace físico
• No permite distinguir el tráfico por QoS (ToS, VLAN, DSCP,
…). Todo se mide igual.
• No permite obtener unos resultados contrastables con los
parámetros definidos en un SLA (Service Level Agreement)
puesto que no se miden exactamente los mismos parámetros
(KPI)
RFC2544/Y.1564 – Y.1731/TWAMP 4
Ventajas Y.1564
• Permite medir el SLA de múltiples servicios sobre un mismo
enlace físico
• Permite reducir el tiempo de medida y medir variaciones de
latencia (FDV)
RFC2544/Y.1564 – Y.1731/TWAMP 5
Y.1564 – Servicios y SLA
• La velocidad del tráfico se define como el perfil de ancho de banda y los parámetros del SLA se conocen como Criterios de Aceptación del Servicio SAC (Service Acceptance Criteria). En el perfil de ancho de banda se especifica la cantidad de tráfico que el Cliente está autorizado a transmitir y como se han de priorizar las tramas dentro de la red y estádefinido por:
• CIR ( COMMITED INFORMATION RATE), tráfico garantizado o verde, velocidad
máxima (KBPS, MBPS, GBPS) sin sufrir
pérdidas o descartes.
• EIR ( EXCESS INFORMATION RATE), tráfico amarillo es el exceso por encima del
CIR y que podría presentar pérdidas en
caso de congestión de la red.
• TRÁFICO DESCARTADO o rojo, tráfico por
encima del EIR que no puede ser
transmitido sin descartar otros tráficos.
RFC2544/Y.1564 – Y.1731/TWAMP 6
Otros parámetros del perfil de ancho de banda
• CBS (COMMITTED BURST SIZE) TAMAÑO DE RÁFAGA COMPROMETIDO, valor en Kbytes o Mbytes equivalente al número
máximo de tramas consecutivas cuyo envío está garantizado a la
velocidad máxima de línea. Por ejemplo: un servicio contratado con
CIR=10 Mbps, CBS=20 KB en una línea de 100Mbps, se garantizará el
envió de ráfagas de 20 KB a 100Mbps
• EBS (EXCESS BURST SIZE) TAMAÑO DE RÁFAGA EN EXCESO, valor
en Kbytes, Mbytes equivalente al número máximo de tramas consecutivas
por encima del CBS que serán enviadas a la red en Best Effort, pero
podría haber pérdida de tramas en caso de congestión de la red. Por
ejemplo: un servicio contratado con CIR=10 Mbps, CBS=20 KB, EBS=25
KB en una línea de 100Mbps, se garantizará el envío de ráfagas de 20KB
a 100Mbps y los siguientes 25KB se enviarán según Best Effort sin
garantía de entrega.
RFC2544/Y.1564 – Y.1731/TWAMP 7
Métricas Y.1564 (sólo para tráfico CIR)
• FTD (FRAME TRANSFER DELAY o LATENCIA) retardo de transferencia de
trama. Es el tiempo máximo (en mseg) que las tramas pueden tardar desde el
origen al destino. Si los extremos no tienen un mecanismo para sincronizar sus
relojes entonces se mide el RTD (ROUND TRIP DELAY) o retardo de ida y vuelta,
donde la trama es devuelta por un bucle en el extremo remoto y la medición se
realiza únicamente en el extremo local.
• FDV ( FRAME DELAY VARIATION) variación de retardo de trama o JITTERmáximo (mseg) permitido. Importante para transmisión de voz y video.
• FLR (FRAME LOSS RATIO) porcentaje máximo de tramas perdidas (% o 10E-X)
del total transmitidas.
• AVAIL ( AVAILABILITY) disponibilidad mínima (%) del servicio que aún cumple
con el SLA. El servicio se considera no disponible si más del 50% de las tramas
son erróneas o se han perdido en un intervalo igual o superior a 1 seg. (estos
criterios pueden personalizarse por el operador en función del tipo de servicio
proporcionado)
RFC2544/Y.1564 – Y.1731/TWAMP 8
RFC2544 vs Y.1564
No se contempla su medición en
RFC2544.
Se mide con tráfico generado a CIR
asegurándonos la correcta priorización
y transmisión del tráfico afectado.
Frame Delay
Variation
La medida se realiza durante la
distribución de medidas de Throughput
de forma que las tramas son generadas
en intervalos de tiempo específicos. En
cualquier caso no podemos confrontar
estos resultados con nuestro SLA.
La medida se realiza durante el test de
Throughput reduciendo el tiempo total
de medida.
Frame Loss
RFC2544 mide una trama en cada test
lo que no permite medir la variación de
este retardo en un tiempo prolongado
del test..
Mide la latencia máxima y la media
durante el test para todas las tramas
generadas. Por tanto permite medir la
desviación de latencia por encima del
SLA e identificar la latencia real de los
servicios transmitidos a través de la red.
Frame Delay
RFC 2544 sólo se centra en la caudal
máximo del enlace sin separación del
tráfico comprometido (CIR) o en exceso
(EIR).
El test se realiza a la velocidad del CIR
y se verifica su cumplimiento de forma
constante durante el test. El tráfico por
exceso y descartado no se ignora y se
mide igualmente.
Throughput
RFC 2544Y.1564 (EtherSAM)
RFC2544/Y.1564 – Y.1731/TWAMP 9
Conclusiones
• RFC2544 sirve para medir un enlace punto a punto entre dos
equipos, no para medir un servicio ‘end-to-end’ que involucra
diferentes redes y tecnologías de transporte
• Y.1564 resuelve las limitaciones anteriores y ofrecer KPIs
asimilables a los SLA de los servicios
• Ambas mediciones son ‘intrusivas’ y por tanto se deberán
usar únicamente para la puesta en servicio y obtención del
‘birdth certificate’
RFC2544/Y.1564 – Y.1731/TWAMP 10
Medidas TWAMP
• Latencia y jitter
• Si no tenemos un reloj común (GPS o 1588)
sólo podemos medir RTD (Round Trip Delay)
• Los paquetes TWAMP se marcan en tiempo al
ser enviados y recibidos tanto en origen
(Generator) como en destino (Reflector)
• Tiempo de proceso de paquetes = T_tx2 –
T_rx1 (se resta del total)
• El Jitter se mide como la diferencia en RTD
entre un paquete y el siguiente
• Packet loss se mide SOLO en los paquetes
TWAMP
• Medidas (1 pps)
• 96 x 15 min = 24h (registro)
• 30 x 24 h = 1 mes (histórico)
RFC2544/Y.1564 – Y.1731/TWAMP 11
SLA
• SLA se mide en términos de:
• FLR Frame Loss Ratio (TWAMP packet loss)
• FTD Frame Transfer Delay (network transfer delay)
• IFDV Interframe Delay Variation (jitter)
• Cuando alguna medida sobrepasa los umbrales del SLA se
genera una alarma (trap SNMP)
• Limitación SLA: normalmente las anomalías se definen sobre
un período largo de tiempo (24h o 30 días) de forma que no
permiten registrar problemas de corta duración
• Los equipos NetTESTER incluyen un mecanismo de
monitorización de corta duración (1 hora, típicamente) para
alertar al NOC antes de que el cliente se queje a través de su
SLA
RFC2544/Y.1564 – Y.1731/TWAMP 12
Arquitectura Y.1731
• MEG - Maintenance Entity Group – Grupo de MEs
• ME - Maintenance Entity – Agrupa los MEPs que terminan las conexiones
• MEP - Maintenance End Point – Dos para punto a punto o varios para
punto-mutipunto
RFC2544/Y.1564 – Y.1731/TWAMP 13
Medidas Y.1731
• CCM - Continuity Check Message• Mensaje CCM Multicast (1 pps típicamente)
• Si un MEP para de transmitir mensajes CCM los otros MEPs envían una alarma
• El mensaje incluye el estado de los puertos locales del MEP
• DMM/DMR - Delay Measurement Message/Reply• Se usa para medir latencia y jitter
• En ausencia de reloj común (GPS/1588) solo podemos medir ida y vuelta (RTD)
• DMM PDU 1 pps con marca de tiempo en tx y rx
• DMR PDU respuesta que incluye las marcas de tiempo del DMM y añade nuevas. A través de la resta de estas marcas obtenemos RTD (igual que en TWAMP)
• Paquetes Unicast entre dos MEPs concretos en la red
• En aplicaciones multipunto debemos definir múltiples sesiones MEP - MEP
RFC2544/Y.1564 – Y.1731/TWAMP 14
Medidas Y.1731 (cont.)
• LMM/LMR – Loss Measurment Message/Reply• Se usa para medir frame loss
• LMM se marca con el contador de paquetes transmitidos del EVC (Ethernet Virtual Circuit) en transmisión y con el contador de paquetes recibidos en recepción
• LMR se marca con los contadores en el sentido inverso
• Comparando estas marcas en ambos extremos podemos calcular el FLR (Frame Loos Ratio) sobre TODO EL TRAFICO DEL EVC y no sólo sobre los paquetes LMM/LMR
• Sólo funciona en conexiones punto a punto (contamos todos los paquetes)
• SMM/SMR – Synthetic Loss Measurment Message/Reply• Se usa para estimar FLR
• Se envían paquetes SLM a ritmo de 1 pps
• SMM se marca con un número de secuencia autoincrementado
• SMR también se marca con un número de secuencia en el sentido opuesto
• La pérdida o salto de un número de secuencia implica FL en los paquetes SM
• SLA FLR de 0,01% implica un paquete perdido de 10000 = 10000 seg (2,7h)
• SLA basados en SMM/SMR deben procesarse en períodos de 24h o 30 días