medidas para la activación y puesta en servicio y monitorización de circuitos ethernet

14
RFC2544/Y.1564 – Y.1731/TWAMP Medidas para la activación y puesta en servicio y monitorización de circuitos Ethernet Noviembre 2016 José R. Salvador

Upload: jose-ramon-salvador-collado

Post on 07-Feb-2017

56 views

Category:

Technology


0 download

TRANSCRIPT

Page 1: Medidas para la activación y puesta en servicio y monitorización de circuitos ethernet

RFC2544/Y.1564 – Y.1731/TWAMP

Medidas para la activación y puesta en servicio y monitorización de circuitos

Ethernet

Noviembre 2016

José R. Salvador

Page 2: Medidas para la activación y puesta en servicio y monitorización de circuitos ethernet

RFC2544/Y.1564 – Y.1731/TWAMP 2

Indice

• Medidas para activación y puesta en servicio (EtherSAM)

• Intrusivas

• RFC2544

• Y.1564

• Medidas para la monitorización de enlaces Ethernet (KPI vs

SLA)

• No intrusivas

• Y.1731 (L2)

• TWAMP (L3)

Page 3: Medidas para la activación y puesta en servicio y monitorización de circuitos ethernet

RFC2544/Y.1564 – Y.1731/TWAMP 3

Inconvenientes RFC2544

• Pensada para entorno de laboratorio pero no en campo real

• Pensada para una conexión punto a punto (mide la capacidad

máxima de un link), pero no para un servicio ‘end-to-end’ con

múltiples enlaces ni velocidades inferiores al caudal máximo

del enlace físico

• No permite distinguir el tráfico por QoS (ToS, VLAN, DSCP,

…). Todo se mide igual.

• No permite obtener unos resultados contrastables con los

parámetros definidos en un SLA (Service Level Agreement)

puesto que no se miden exactamente los mismos parámetros

(KPI)

Page 4: Medidas para la activación y puesta en servicio y monitorización de circuitos ethernet

RFC2544/Y.1564 – Y.1731/TWAMP 4

Ventajas Y.1564

• Permite medir el SLA de múltiples servicios sobre un mismo

enlace físico

• Permite reducir el tiempo de medida y medir variaciones de

latencia (FDV)

Page 5: Medidas para la activación y puesta en servicio y monitorización de circuitos ethernet

RFC2544/Y.1564 – Y.1731/TWAMP 5

Y.1564 – Servicios y SLA

• La velocidad del tráfico se define como el perfil de ancho de banda y los parámetros del SLA se conocen como Criterios de Aceptación del Servicio SAC (Service Acceptance Criteria). En el perfil de ancho de banda se especifica la cantidad de tráfico que el Cliente está autorizado a transmitir y como se han de priorizar las tramas dentro de la red y estádefinido por:

• CIR ( COMMITED INFORMATION RATE), tráfico garantizado o verde, velocidad

máxima (KBPS, MBPS, GBPS) sin sufrir

pérdidas o descartes.

• EIR ( EXCESS INFORMATION RATE), tráfico amarillo es el exceso por encima del

CIR y que podría presentar pérdidas en

caso de congestión de la red.

• TRÁFICO DESCARTADO o rojo, tráfico por

encima del EIR que no puede ser

transmitido sin descartar otros tráficos.

Page 6: Medidas para la activación y puesta en servicio y monitorización de circuitos ethernet

RFC2544/Y.1564 – Y.1731/TWAMP 6

Otros parámetros del perfil de ancho de banda

• CBS (COMMITTED BURST SIZE) TAMAÑO DE RÁFAGA COMPROMETIDO, valor en Kbytes o Mbytes equivalente al número

máximo de tramas consecutivas cuyo envío está garantizado a la

velocidad máxima de línea. Por ejemplo: un servicio contratado con

CIR=10 Mbps, CBS=20 KB en una línea de 100Mbps, se garantizará el

envió de ráfagas de 20 KB a 100Mbps

• EBS (EXCESS BURST SIZE) TAMAÑO DE RÁFAGA EN EXCESO, valor

en Kbytes, Mbytes equivalente al número máximo de tramas consecutivas

por encima del CBS que serán enviadas a la red en Best Effort, pero

podría haber pérdida de tramas en caso de congestión de la red. Por

ejemplo: un servicio contratado con CIR=10 Mbps, CBS=20 KB, EBS=25

KB en una línea de 100Mbps, se garantizará el envío de ráfagas de 20KB

a 100Mbps y los siguientes 25KB se enviarán según Best Effort sin

garantía de entrega.

Page 7: Medidas para la activación y puesta en servicio y monitorización de circuitos ethernet

RFC2544/Y.1564 – Y.1731/TWAMP 7

Métricas Y.1564 (sólo para tráfico CIR)

• FTD (FRAME TRANSFER DELAY o LATENCIA) retardo de transferencia de

trama. Es el tiempo máximo (en mseg) que las tramas pueden tardar desde el

origen al destino. Si los extremos no tienen un mecanismo para sincronizar sus

relojes entonces se mide el RTD (ROUND TRIP DELAY) o retardo de ida y vuelta,

donde la trama es devuelta por un bucle en el extremo remoto y la medición se

realiza únicamente en el extremo local.

• FDV ( FRAME DELAY VARIATION) variación de retardo de trama o JITTERmáximo (mseg) permitido. Importante para transmisión de voz y video.

• FLR (FRAME LOSS RATIO) porcentaje máximo de tramas perdidas (% o 10E-X)

del total transmitidas.

• AVAIL ( AVAILABILITY) disponibilidad mínima (%) del servicio que aún cumple

con el SLA. El servicio se considera no disponible si más del 50% de las tramas

son erróneas o se han perdido en un intervalo igual o superior a 1 seg. (estos

criterios pueden personalizarse por el operador en función del tipo de servicio

proporcionado)

Page 8: Medidas para la activación y puesta en servicio y monitorización de circuitos ethernet

RFC2544/Y.1564 – Y.1731/TWAMP 8

RFC2544 vs Y.1564

No se contempla su medición en

RFC2544.

Se mide con tráfico generado a CIR

asegurándonos la correcta priorización

y transmisión del tráfico afectado.

Frame Delay

Variation

La medida se realiza durante la

distribución de medidas de Throughput

de forma que las tramas son generadas

en intervalos de tiempo específicos. En

cualquier caso no podemos confrontar

estos resultados con nuestro SLA.

La medida se realiza durante el test de

Throughput reduciendo el tiempo total

de medida.

Frame Loss

RFC2544 mide una trama en cada test

lo que no permite medir la variación de

este retardo en un tiempo prolongado

del test..

Mide la latencia máxima y la media

durante el test para todas las tramas

generadas. Por tanto permite medir la

desviación de latencia por encima del

SLA e identificar la latencia real de los

servicios transmitidos a través de la red.

Frame Delay

RFC 2544 sólo se centra en la caudal

máximo del enlace sin separación del

tráfico comprometido (CIR) o en exceso

(EIR).

El test se realiza a la velocidad del CIR

y se verifica su cumplimiento de forma

constante durante el test. El tráfico por

exceso y descartado no se ignora y se

mide igualmente.

Throughput

RFC 2544Y.1564 (EtherSAM)

Page 9: Medidas para la activación y puesta en servicio y monitorización de circuitos ethernet

RFC2544/Y.1564 – Y.1731/TWAMP 9

Conclusiones

• RFC2544 sirve para medir un enlace punto a punto entre dos

equipos, no para medir un servicio ‘end-to-end’ que involucra

diferentes redes y tecnologías de transporte

• Y.1564 resuelve las limitaciones anteriores y ofrecer KPIs

asimilables a los SLA de los servicios

• Ambas mediciones son ‘intrusivas’ y por tanto se deberán

usar únicamente para la puesta en servicio y obtención del

‘birdth certificate’

Page 10: Medidas para la activación y puesta en servicio y monitorización de circuitos ethernet

RFC2544/Y.1564 – Y.1731/TWAMP 10

Medidas TWAMP

• Latencia y jitter

• Si no tenemos un reloj común (GPS o 1588)

sólo podemos medir RTD (Round Trip Delay)

• Los paquetes TWAMP se marcan en tiempo al

ser enviados y recibidos tanto en origen

(Generator) como en destino (Reflector)

• Tiempo de proceso de paquetes = T_tx2 –

T_rx1 (se resta del total)

• El Jitter se mide como la diferencia en RTD

entre un paquete y el siguiente

• Packet loss se mide SOLO en los paquetes

TWAMP

• Medidas (1 pps)

• 96 x 15 min = 24h (registro)

• 30 x 24 h = 1 mes (histórico)

Page 11: Medidas para la activación y puesta en servicio y monitorización de circuitos ethernet

RFC2544/Y.1564 – Y.1731/TWAMP 11

SLA

• SLA se mide en términos de:

• FLR Frame Loss Ratio (TWAMP packet loss)

• FTD Frame Transfer Delay (network transfer delay)

• IFDV Interframe Delay Variation (jitter)

• Cuando alguna medida sobrepasa los umbrales del SLA se

genera una alarma (trap SNMP)

• Limitación SLA: normalmente las anomalías se definen sobre

un período largo de tiempo (24h o 30 días) de forma que no

permiten registrar problemas de corta duración

• Los equipos NetTESTER incluyen un mecanismo de

monitorización de corta duración (1 hora, típicamente) para

alertar al NOC antes de que el cliente se queje a través de su

SLA

Page 12: Medidas para la activación y puesta en servicio y monitorización de circuitos ethernet

RFC2544/Y.1564 – Y.1731/TWAMP 12

Arquitectura Y.1731

• MEG - Maintenance Entity Group – Grupo de MEs

• ME - Maintenance Entity – Agrupa los MEPs que terminan las conexiones

• MEP - Maintenance End Point – Dos para punto a punto o varios para

punto-mutipunto

Page 13: Medidas para la activación y puesta en servicio y monitorización de circuitos ethernet

RFC2544/Y.1564 – Y.1731/TWAMP 13

Medidas Y.1731

• CCM - Continuity Check Message• Mensaje CCM Multicast (1 pps típicamente)

• Si un MEP para de transmitir mensajes CCM los otros MEPs envían una alarma

• El mensaje incluye el estado de los puertos locales del MEP

• DMM/DMR - Delay Measurement Message/Reply• Se usa para medir latencia y jitter

• En ausencia de reloj común (GPS/1588) solo podemos medir ida y vuelta (RTD)

• DMM PDU 1 pps con marca de tiempo en tx y rx

• DMR PDU respuesta que incluye las marcas de tiempo del DMM y añade nuevas. A través de la resta de estas marcas obtenemos RTD (igual que en TWAMP)

• Paquetes Unicast entre dos MEPs concretos en la red

• En aplicaciones multipunto debemos definir múltiples sesiones MEP - MEP

Page 14: Medidas para la activación y puesta en servicio y monitorización de circuitos ethernet

RFC2544/Y.1564 – Y.1731/TWAMP 14

Medidas Y.1731 (cont.)

• LMM/LMR – Loss Measurment Message/Reply• Se usa para medir frame loss

• LMM se marca con el contador de paquetes transmitidos del EVC (Ethernet Virtual Circuit) en transmisión y con el contador de paquetes recibidos en recepción

• LMR se marca con los contadores en el sentido inverso

• Comparando estas marcas en ambos extremos podemos calcular el FLR (Frame Loos Ratio) sobre TODO EL TRAFICO DEL EVC y no sólo sobre los paquetes LMM/LMR

• Sólo funciona en conexiones punto a punto (contamos todos los paquetes)

• SMM/SMR – Synthetic Loss Measurment Message/Reply• Se usa para estimar FLR

• Se envían paquetes SLM a ritmo de 1 pps

• SMM se marca con un número de secuencia autoincrementado

• SMR también se marca con un número de secuencia en el sentido opuesto

• La pérdida o salto de un número de secuencia implica FL en los paquetes SM

• SLA FLR de 0,01% implica un paquete perdido de 10000 = 10000 seg (2,7h)

• SLA basados en SMM/SMR deben procesarse en períodos de 24h o 30 días