procesos de itil availability management continuación … maestro alfonso moreno perdomo marzo de...

73
Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

Upload: goito-villasana

Post on 22-Apr-2015

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

Procesos de ITILAvailability Management

Continuación …

Maestro Alfonso Moreno Perdomo

Marzo de 2008

Page 2: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability ManagementLos Conceptos

Page 3: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability ManagementLos conceptos

AMPLIANDO LOS CONCEPTOSAvailability• Alta disponibilidad significa que el servicio de TI esté

continuamente disponible para el cliente, mientras que hay poco tiempo abajo (downtime) y se cuenta con una rápida recuperación del servicio.

• La disponibilidad alcanzada es indicada por métricas. La disponibilidad del servicio depende de:

1. Complejidad de la arquitectura de infraestructura de TI.2. Confiabilidad de los componentes3. Habilidad para responder rápida y eficientemente a las fallas.4. Calidad del mantenimiento realizado por las organizaciones y

proveedores de soporte.5. Calidad y alcance de los procesos de gestión operacional.

Page 4: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability ManagementLos hechos

AMPLIANDO LOS CONCEPTOSReliability• Adecuar la fiabilidad significa que el

servicio está disponible para un periodo acordado, sin interrupción.

• Este concepto incluye la elasticidad/resistencia (resilience), la cual se incrementa si el tiempo no disponible (downtime) puede ser previsto.

Page 5: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability ManagementLos hechos

AMPLIANDO LOS CONCEPTOSReliability• Se calcula empleando estadísticas y se

determina como una combinación de:1. Fiabilidad de los componentes usados para proveer

el servicio.2. Habilidad de un servicio o componente para operar

efectivamente, sin importar fallas de uno o más subsistemas (resilience).

3. Mantenimiento preventivo para evitar caídas del servicio.

Page 6: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability ManagementLos hechos

AMPLIANDO LOS CONCEPTOSMaintainability• La sustentabilidad (maintainability) y recuperabilidad

(recoverability) se refieren a las actividades necesarias para mantener el servicio en operación y restaurarlo cuando hay fallas.

• Esto incluye mantenimiento preventivo y calendarios de inspección. Estos conceptos incluyen:

– Toma de mediciones para prevenir fallas– Detección de fallas– Realización de un diagnóstico, incluyendo diagnóstico automatizado

de los componentes mismos– Resolución de las fallas– Recuperación después de la falla– Restauración del servicio

Page 7: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability ManagementLos hechos

AMPLIANDO LOS CONCEPTOSServiceability• La disponibilidad de servicio tiene que ver con las

obligaciones contractuales de proveedores de servicio externos (contratistas, terceros, etc.) Los contratos definen el soporte que será proporcionado por los servicios dados a outsourcing.

• Como esto concierne únicamente a una parte del servicio de TI, el término “no se refiere” a la disponibilidad “total” del servicio.

• Si un contratista es responsable por el servicio como un todo – por ejemplo cuando un contrato de Gestión de Instalaciones (facilities) se concluye – entonces los términos serviceability y availability son sinónimos.

Page 8: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability ManagementLos hechos

AMPLIANDO LOS CONCEPTOSServiceability• La Gestión de Disponibilidad efectiva requiere de un

exhaustivo y amplio entendimiento tanto del negocio como del ambiente de TI.

• Es importante estar consciente de que la disponibilidad no puede ser simplemente “comprada”.

• La Disponibilidad tiene que ser incluida en el diseño e implementación desde la etapa inicial de diseño.

• Finalmente, la disponibilidad depende de la complejidad de la infraestructura, la fiabilidad de los componentes, el profesionalismo de la organización de TI y sus contratistas, y de la calidad del proceso mismo.

Page 9: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management

AMPLIANDO LOS OBJETIVOS• Dentro de las actividades proactivas y reactivas,

debemos considerar las siguientes premisas:1. La introducción de Gestión de Disponibilidad es esencial para

obtener un alto grado de satisfacción del cliente. La disponibilidad y fiabilidad en el largo tiempo expresa cómo los clientes perciben el servicio proporcionado por una organización de TI

2. Siempre habrá fallas, sin importar el alto grado de disponibilidad. La Gestión de Disponibilidad tiene la suma responsabilidad de una respuesta profesional ante tales situaciones indeseables

3. El diseño del proceso demanda no solamente una amplia comprensión de la TI, sino también una apreciación del proceso y servicios de los clientes. Los objetivos pueden ser alcanzados mediante una combinación de estos dos aspectos.

Page 10: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management EL PROCESO

Actividades de la Gestión de Disponibilidad

Page 11: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management EL PROCESO

Actividades de la Gestión de Disponibilidad• En lo posible, componentes esenciales están

duplicados y la detección de fallas y sistemas de corrección se usan para cumplir con estándares de alta disponibilidad.

• A menudo, se emplean sistemas automáticos de respaldo ante fallas eventuales.

• Sin embargo, es necesario introducir la Gestión de Disponibilidad para la toma de mediciones organizacionales.

Page 12: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management EL PROCESO

Actividades de la Gestión de Disponibilidad• La Gestión de Disponibilidad puede arrancar una vez que el negocio ha identificado

claramente sus requerimientos de disponibilidad del servicio. Es un proceso continuo que solamente termina cuando el servicio es cerrado.

• Las entradas de la Gestión de Disponibilidad son: Requerimientos de Disponibilidad del Servicio Evaluación del impacto para todos los procesos de negocio soportados

por TI. Requerimientos de disponibilidad, fiabilidad y sustentabilidad para los

componentes de TI en la infraestructura. Datos acerca de las fallas que afecten servicios o componentes,

generalmente en la forma de registros y reportes de incidentes y problemas.

Configuración y monitoreo de datos acerca de los componentes y servicios.

Niveles de Servicio alcanzados, comparados con los niveles de servicio acordados para todos los servicios cubiertos bajo el SLA.

Page 13: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management EL PROCESO

Actividades de la Gestión de Disponibilidad• Las salidas de la Gestión de Disponibilidad son:

Criterios de diseño de la disponibilidad y recupración para servicios de TI nuevos y mejorados.

Tecnología necesaria para obtener la resistencia/elasticidad (resilience) requerida por la infraestructura para reducir o eliminar el impacto de fallas en los componentes de dicha infraestructura.

Reportes de disponibilidad, fiabilidad y sustentabilidad alcanzados.

Requerimientos de monitoreo de disponibilidad, fiabilidad y sustentabilidad.

Un Plan de Disponibilidad para el mejoramiento proactivo de la infraestructura de TI.

Page 14: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management EL PROCESO

Relación con otros procesosService Level Management• Es responsable de la negociación y gestión de los SLA´s, en los

cuales, la disponibilidad es uno de los elementos más importantes.Configuration Management• Posee información acerca de la infraestructura y puede proporcionar

información valiosa al la Gestión de DisponibilidadCapacity Management• Los cambios en la capacidad generalmente afectan la disponibilidad

de un servicio y cambios en la disponibilidad afectarán la capacidad.• La Gestión de Capacidad cuenta con amplia información disponible,

incluyendo información acerca de la infraestructura de TI. Es decir, estos dos procesos a menudo intercambian información acerca de escenarios para escalamiento (upgrades) y obsolescencia de componentes de TI, y acerca de las tendencias de disponibilidad que pueden requerir cambios en los requerimientos de capacidad.

Page 15: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management EL PROCESO

Relación con otros procesos

IT Service Continuity Management• Availability Management NO es responsable de restaurar los

procesos de negocio después de un desastre.• Esta es la responsabilidad de IT Service Continuity Management.

ITSCM provee a Availability Management de información acerca de procesos críticos de negocio.

• También, en la práctica, provee a AM de muchas de las medidas tomadas para mejorar para aumentar la Disponibilidad, también mejoran la Continuidad en el Servicio de TI y viceversa.

Problem Management• Posee información acerca de la infraestructura y puede proporcionar

información valiosa a la Gestión de Disponibilidad

Page 16: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management EL PROCESO

Relación con otros procesosIncident Management• Especifica cómo deben resolverse los incidentes. Este proceso

provee reportes con información acerca de tiempos de recuperación, tiempos de reparación, etc.

• Esta información es usada para determinar la disponibilidad alcanzada.

Security Management• Tiene fuertes lazos con Availability Management. Los 3 asuntos

básicos en Security Management son:1. Confidencialidad2. Integridad3. Disponibilidad

• Los criterios de seguridad deben ser considerados para determinar los requerimientos de disponibilidad.

• Availability Management puede proporcionar puede proporcionar valiosa información a Security Management, particularmente acerca de nuevos servicios.

Page 17: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management EL PROCESO

Relación con otros procesos

Change Management• Availability Management informa a Change Management acerca de

asuntos de mantenimiento referentes a nuevos servicios y elementos del estos mismos, e inicia el proceso de Change Management para implementar los cambios requeridos por las mediciones de disponibilidad.

• Change Management informa a Availability Management acerca de los cambios agendados (FSC-Forward Schedule of Change).

• FSC contiene todos los cambios aprobados y la fecha propuesta para su implementación.

Page 18: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Determinación de requerimientos de disponibilidad• Esta actividad debe ser llevada a cabo antes de que se

concluya el SLA y debe ser enfocada tanto a nuevos servicios como a la mejora de servicios existentes.

• Se debe decidir en la etapa más temprana posible, si la organización de TI puede cumplir y se debe decidir “cómo” serán cumplidos dichos requerimientos.

• Esta actividad debe identificar:1. Funciones clave para la organización2. Definición del acuerdo de no disponibilidad del servicio (downtime)

de TI.3. Requerimientos cuantificables de disponibilidad.4. Impacto cuantificable sobre las funciones del negocio de tiempo sin

servicio de TI (downtime) no calendarizado.5. Horas de negocio del cliente.6. Acuerdos acerca de ventanas de mantenimiento.

Page 19: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Determinación de requerimientos de disponibilidad

• Es esencial esclarecer de forma temprana los requerimientos de disponibilidad para prevenir confusiones y diferencias de interpretación en etapas posteriores.

• Los requerimientos de los clientes deben ser comparados con lo que puede ser proporcionado. Si hay desajustes, entonces se deberá determinar el costo del impacto.

Page 20: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Diseño de la Disponibilidad

• La vulnerabilidad que afecte los estándares de disponibilidad debe ser identificada tan pronto como sea posible.

• Esto evitará excesivos costos de desarrollo y gastos no planeados en etapas posteriores, Puntos individuales de Fallas (Single Points of Failure), costos adicionales cargados por proveedores y entregas retrasadas.

• Un buen diseño, basado en los estándares apropiados de disponibilidad, hará posible concluir efectivamente los contratos de mantenimiento con proveedores. El diseño del proceso emplea un rango de técnicas tales como Components Failure Impact Analysus (CFIA)

Page 21: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Diseño de la Disponibilidad

• Components Failure Impact Analysis (CFIA) es una técnica desarrollada por IBM, la cual usa una matrix para identificar las áreas de riesgo en la provisión de servicios de TI, mediante el encadenamiento de fllas de componentes individuales a su impacto en el nivel total de servicio provisto.

• CFIA sirve para identificar SPOF’s (Single Point of Failure) que se refiere a cualquier componente de un sistema que pueda causar un malfuncionamiento del sistema entero, CRAMM (CCTA Risk Analysis & Management Method ).

• También se emplean técnicas de simulación para diseño de procesos enfocados a la disponibilidad.

Page 22: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Diseño de la Disponibilidad• CRAMM (CCTA* Risk Analysis & Management Method ).

También se emplean técnicas de simulación para diseño de procesos enfocados a la disponibilidad.

* CCTA - Consumer Credit Trade Association

Page 23: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Diseño de la Disponibilidad• Si los estándares de disponibilidad no pueden ser

alcanzados, la mejor opción es determinar si el diseño puede ser probado.

• El uso de tecnologías adicionales, otros métodos, una estrategia diferente de liberación, un diseño diferente o mejor, y herramientas de desarrollo pueden ofrecer oportunidades para cumplir con los estándares.

• Si los requerimientos son particularmente demandantes, entonces se debe considerar el uso de otro tipo de tecnología tolerante a fallas, otro proceso de servicio (Incident, Problem and Change Management), o recursos adicionales de Gestión de Servicios.

• Los recursos financieros disponibles determinan primordialmente la opciones y elecciones.

Page 24: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Diseño de la Sustentabilidad (Design for Maintainability)• Debido a que la disponibilidad ininterrumpida es

difícilmente factible, se deben considerar periodos de indisponibilidad de TI.

• Cuando un servicio de TI es interrumpido es importante que la falla sea resuelta rápida y adecuadamente, y que los estándares de disponibilidad acordados sean cumplidos.

• El diseño de la recuperabilidad (recoverability) involucra asuntos tales como un proceso de Gestión de Incidentes efectivo con procedimientos adecuados de escalación, comunicación, respaldo y recuperación.

• Las tareas, responsabilidades y autoridad deben ser definidas claramente.

Page 25: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Asuntos claves de seguridad

• La seguridad y la confiabilidad del sistema están íntimamente ligadas. Un diseño de seguridad de la información pobre puede afectar la disponibilidad del servicio.

• La alta disponibilidad puede ser soportada por una efectiva seguridad de la información.

• Durante la etapa de planeación, el asunto de la seguridad debe ser considerado y su impacto en le provisión de servicios debe ser analizado.

Page 26: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Asuntos claves de seguridad

• Algunos de los asuntos a clave son:

Determinar quién está autorizado para acceder a áreas seguras

Determinar qué autorizaciones críticas deben ser expedidas

Page 27: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Gestión del Mantenimiento

• Normalmente deberá haber ventanas de indisponibilidad de TI agendadas o calendarizadas.

• Estos periodos pueden ser usados para acciones preventivas, tales como actualizaciones de hardware y software.

• Los cambios también pueden ser implementados durante estas ventanas.

• Sin embargo, en una economía de 24-horas se vuelve más y más difícil determinar ventanas de indisponibilidad apropiadas.

Page 28: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Medición y Reporteo

• Proveen las bases para la verificación de SLA’s, la resolución de problemas y la definición de propósitos para mejoramiento.

• Si no se puede medir, no se puede manejar• Si no se puede medir, no se puede mejorar• Si no se puede medir, probablemente no nos interesa• Si no se puede influenciar, entonces, no se debe medir

Page 29: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Medición y Reporteo• La medición y reporteo es una actividad importante del

Availability Magement porque proporciona las bases para verificar los acuerdos de servicio, resolver problemas, y definir propuestas de mejora.

• El ciclo de vida de cada incidente incluye los siguientes elementos:

– Ocurrencia del incidente – el tiempo en el cual el usuario se percata de la falla, o cuando la falla es identificada por otros medios (técnicos o físicos).

– Detección – el proveedor del servicio es informado de la falla. El status del incidente es en este momento “reportado”. El tiempo que toma esto es conocido como el tiempo de detección (detection time).

Page 30: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Medición y Reporteo• La medición y reporteo es una actividad importante del Availability

Management porque proporciona las bases para verificar los acuerdos de servicio, resolver problemas, y definir propuestas de mejora.

• El ciclo de vida de cada incidente incluye los siguientes elementos:– Response – El proveedor del servicio necesita tiempo para responder.

Esto es conocido como el tiempo de respuesta (response time). Este tiempo es usado para diagnóstico, el cual puede ir seguido de la reparación correspondiente. El proceso de Incident Management incluye Aceptación y Registro, Clasificación, Concordancia, Análisis y Diagnóstico.

– Reparación – El proveedor del servicio restaura el servicio o los componentes que causaron la falla.

– Recuperación del Servicio – El servicio es restaurado. Esto incluye actividades tales como configuración e inicialización, y el servicio es restaurado al usuario.

Page 31: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Medición y ReporteoLa Figura ilustra los periodos que pueden ser medidos.

Page 32: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Medición y Reporteo• El tiempo de respuesta de la organización de TI y de

cualquiera de los contratistas o proveedores de servicios, es uno de los factores que determinan el tiempo abajo (downtime). Como este factor puede ser controlado por la organización de TI y afecta directamente el servicio, los acuerdos acerca de ello pueden ser incluidos en el SLA.

• Las mediciones pueden ser promediadas para dar una buena impresión de los factores relevantes.

• Los promedios pueden ser usados para determinar lso niveles de servicio alcanzados, y para estimar la disponibilidad de un servicio esperada a futuro.

• Esta información también puede ser usada para desarrollar planes de mejoramiento.

Page 33: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Medición y Reporteo

• Las métricas más empleadas comúnmente son:

– Mean Time to Repair (MTTR)

– Mean Time Between Failures (MTBF)

– Mean Time Between System Incidents (MTBSI)

Page 34: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Medición y Reporteo

• Los reportes de disponibilidad pueden incluir las siguientes métricas:

– Tasa de disponiblilidad (o indisponibilidad) en términod ee MTTR, MTBF y MTBSI.

– Tiempo total arriba (uptime) y abajo (downtime).

– Número de fallas.– Información adicional acerca de fallas cuyo

resultado real o potencial deriven en un decremento en la disponibilidad acordada.

Page 35: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Medición y Reporteo

• El problema con el reporteo de la disponibilidad es que las métricas presentadas pueden no corresponder con la percepción del usuario.

• Por ello es importante reportar la disponibilidad desde la perspectiva del usuario.

• El reporte debe proveer principalmente información acerca de la disponibilidad de los servicios esenciales para las funciones del negocio, servicios de aplicación, y la disponibilidad de los datos (punto de vista del negocio), en ves de contener información acerca de los componentes técnicos de TI.

• Deben ser escritos en lenguaje que el usuario pueda entender.

Page 36: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Desarrollo del Plan de Disponibilidad• El Plan de Disponibilidad es uno de los mayores

productos del Availability Management.• Es un plan de largo plazo concerniente a la disponibilidad

para unos cuantos próximos años.• No es el plan de Implementación del Availability

Management.• Debe ser un documento viviente.• Inicialmente debe describir las situaciones actuales, y en

una etapa posterior puede extenderse para incluir actividades de mejora y lineamientos para los servicios existentes, así como planes para nuevos servicios, y lineamientos para su mantenimiento.

Page 37: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Desarrollo del Plan de Disponibilidad

• Un Plan completo de Disponibilidad requiere vinculación con áreas tales como Service Level management, IT Service Continuity Management, Capacity Management, y Financia Management for IT Services and Application Development (directamente o a través de Change Management).

Page 38: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Herramientas• Para ser eficiente, el Availability

Management debe usar un conjunto de herramientas para las siguientes actividades:

• Determinación del downtime• Registro histórico de información• Generación de reportes• Análisis Estadístico • Análisis de Impacto

Page 39: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Herramientas

• Availability Management usa información proveniente de registros de Incident Management, el CMDB y la Capacity Database.

• La información puede ser almacenada en una base de datos de Availability Management (AMDB)

Page 40: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Herramientas• Availability Management usa

información proveniente de registros de Incident Management, el CMDB(Configuration Management Data Base) y la Capacity Database.

• La información puede ser almacenada en una base de datos de Availability Management (AMDB)

Page 41: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Métodos y Técnicas

• Hay un amplio espectro de métodos y técnicas para dar soporte a las actividades de planeación, mejoramiento y reporteo.

• Veremos solamente las más importantes.

Page 42: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Métodos y Técnicas (CFIA)Component Failure Impact Analysis

Page 43: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Métodos y Técnicas (CFIA)Component Failure Impact Analysis• Este método usa una matriz de

disponibilidad con los componentes estratégicos y sus roles en cada servicio.

• Un CMDB efectivo que defina las relaciones entre los servicios y la producción de recursos, puede ser de la mayor utilidad cuando se está desarrollando la matriz.

Page 44: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Métodos y Técnicas (CFIA)Component Failure Impact Analysis• En el ejemplo anterior, se muestra que los

elementos de configuración marcados con “X” para muchos servicios, son elementos importantes en la infraestructura de TI (análisis horizontal), y que los servicios que frecuentemente son marcados con “X” son complejos y sensibles a fallas (análisis vertical).

• Este método puede ser aplicado a dependencias de terceros como proveedores o contratistas (Advanced CFIA).

Page 45: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Métodos y Técnicas (FTA)Fault Tree Analysis• Análisis del Árbol de Fallas es una técnica usada

para identificar la cadena de eventos que llevan a fallar a un servicio de TI.

• Se traza un árbol separado para cada servicio, usando símbolos booleanos.

• El árbol es atravesado de abajo hacia arriba (button-up).

Page 46: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Métodos y Técnicas (FTA)Fault Tree Analysis

Page 47: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Métodos y Técnicas (FTA)Fault Tree Analysis• El Análisis del Árbol de Fallas distingue los siguientes

elementos:– Eventos Básicos – entradas en el diagrama (círculos) tales como

caídas de energía eléctrica y errores del operados. Esos eventos no son investigados.

– Eventos Resultantes – nodos en el diagrama, resultantes de eventos anteriores.

– Eventos Condicionales – eventos que sólo ocurren bajo ciertas condiciones, tales como una falla del aire acondicionado.

– Eventos Disparadores (Trigger Events) - eventos que causan otros eventos, tales como una desconexión automática del suministro de corriente iniciada por un UPS.

Page 48: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Métodos y Técnicas (FTA)Fault Tree Analysis• Los eventos pueden estar combinados con

operaciones lógicas, tales como:– Operación AND – El Evento Resultante ocurre si

todas las entradas ocurren simultáneamente.– Operación OR – El Evento Resultante ocurre si una o

más de las entradas ocurrren.– Operación XOR – El Evento Resultante ocurre si sólo

una de las entradas ocurre.– Operación Inhibir – el Evento Resultante ocurre si las

condiciones de la entrada no son satisfechas.

Page 49: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Métodos y Técnicas (FTA)CCTA Risk Analysis and Management

Method(CRAMM)• Describe un medio de identificar

contramedidas justificables para proteger la confidencialidad, integridad y disponibilidad de la infraestructura de TI.

• Este método lo discutiremos en Continuidad del Servicio (IT Service Continuity Management)

Page 50: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Métodos y Técnicas (FTA)

Cálculos de Disponibilidad

• Las métricas discutidas anteriormente pueden ser usadas para decidir acuerdos de disponibilidad con el cliente.

• Estos acuerdos son incluidos en los SLA´s

Page 51: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Métodos y Técnicas (FTA)Cálculos de Disponibilidad

• Esta fórmula puede usarse para determinar si la disponibilidad alcanzada cumple con los requerimientos de la disponibilidad acordada.

% Availability = (AST – DT / AST ) * 100

AST = Agreed Service Time

DT = Downtime real

Page 52: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Métodos y Técnicas (FTA)

Cálculos de Disponibilidad

• El tiempo arriba (uptime) obtenido proviene de la diferencia entre el tiempo acordado (AST) uy el tiempo abajo (DT-downtime) real.

Page 53: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Métodos y Técnicas (FTA)Cálculos de Disponibilidad• Ej.: si se hubiese acordado que el servicio

debería tener una disponibilidad de 98% sobre días laborables de 07:00 a 19:00 horas de lunes a viernes, y el servicio estuvo caído por dos horas durante esta ventana, entonces el tiempo arriba (uptime) alcanzado o porcentaje de disponibilidad sería:

(5 x 12 – 2) (5 x 12) x 100% = 96.7 %

Page 54: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Métodos y Técnicas (FTA)

Service Outage Analysis (SOA)

• Se usa para identificar las causas de las fallas, para investigar la efectividad de la organización de TI y sus procesos, y para presentar e implantar propuestas de mejoramiento.

Page 55: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Métodos y Técnicas (FTA)Service Outage Analysis (SOA)• Las características son:

– Tiene un amplio alcance: no está limitada a infraestructura, sino que también cubre procesos, procedimientos y aspectos culturales.

– Los asuntos son considerados desde la perspectiva del cliente.

– Implementación de reuniones mediante participación de representantes del cliente y la organización de TI (SOA team).

Page 56: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Métodos y Técnicas (FTA)Service Outage Analysis (SOA)

• Las beneficios incluyen:– Enfoque más eficiente– Comunicación directa entre cliente y

proveedor– Amplia base para propuestas de mejora.

Page 57: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management ACTIVIDADES

Métodos y Técnicas (FTA)Technical Observation Post (TOP)• Cuando se emplea este método, se dedica un

equipo de especialistas enfocados a un solo aspecto de la disponibilidad.

• Este método puede ser apropiado donde las herramientas de rutina proporcionan soporte insuficiente.

• El TOP combina también la experiencia de diseñadores y gerentes de sistemas.

Page 58: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management CONTROL DEL PROCESO

Factores críticos del éxito e indicadores de desempeño

• El negocio debe tener claramente definidos los objetivos y deseos de disponibilidad.

• Service Level Management debe haber sido establecido para formalizar los acuerdos

• Ambas partes deben usar las mismas definiciones de disponibilidad y downtime.

• Tanto el negocio como la organización de TI debes estar conscientes de los beneficios de Availability Management.

Page 59: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management CONTROL DEL PROCESO

Factores críticos del éxito e indicadores de desempeño

• Los indicadores de desempeño que muestran efectividad y eficiencia de Availability Management son:

– Porcentaje de disponibilidad (uptime) por servicio o grupos de usuarios

– Duración de downtime– Frecuencia de downtime

Page 60: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management CONTROL DEL PROCESO

Reporteo• Las siguientes métricas pueden ser usadas para

reportes de control del proceso:– Tiempos de Detección– Tiempos de Respuesta– Tiempos de Reparación– Tiempos de Recuperación– Uso exitoso de métodos apropiados (CFIA), CRAMM,

SOA)– Extensión del proceso de implementación: servicios,

SLA´s y grupos de usuarios cubiertos por los SLA’s.

Page 61: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management CONTROL DEL PROCESO

Reporteo

• Se pueden determinar algunas métricas para cada servicio, equipo o infraestructura.

• Ej.:– Redes– Centro de Cómputo– Ambientes de Estaciones de Trabajo

Page 62: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management CONTROL DEL PROCESO

Funciones y Roles• La organización puede establecer el papel del

Availability Manager para definir y controlar el proceso.

• Las tareas del Availability Manager incluyen:– Definir y desarrollar el proceso en la organización– Asegurar que los servicios de TI estén diseñados de

tal forma que correspondan a los niveles de servicio acordados (en términos de availability, reliability, serviceability, maintainability y recoverability)

– Reporteo– Optimización de la disponibilidad de la infraestructura

para proporcionar mejoras efectivas en costo para el servicio entregado al negocio.

Page 63: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management COSTOS Y POSIBLES PROBLEMAS

Costos

• Los costos de Availability Management incluyen:

– Costo de implementación– Costos de personal– Costos de instalaciones– Herramientas de medición y reporteo

Page 64: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management COSTOS Y POSIBLES PROBLEMAS

Costos

• La discusión de costos y beneficios puede ser guiada preguntándose cuál será el costo si ignoráramos completamente el Availability Management y llegáramos a una situación donde los requerimientos de disponibilidad alcanzados no cumplieran con los requerimientos de disponibilidad acordados.

Page 65: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management COSTOS Y POSIBLES PROBLEMAS

Costos

• Estos serían los impactos sobre el cliente:– Productividad reducida– Beneficios y cambios reducidos– Recuperación de costos– Reclamos potenciales de terceros, etc.

Page 66: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management COSTOS Y POSIBLES PROBLEMAS

Costos

• Aspectos importantes, pero difíciles de cuantificar:

– Pérdida de buena voluntad y de clientes– Pérdida de reputación y confianza– Pérdida de motivación y satisfacción del

personal

Page 67: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management COSTOS Y POSIBLES PROBLEMAS

Posibles problemas

• La mayoría de problemas conciernen a la organización.

• Los problemas esperados incluyen:– Los gerentes generales dividen la

responsabilidad por la disponibilidad entre varias disciplinas (gerentes de línea, gerentes de procesos).

Page 68: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management COSTOS Y POSIBLES PROBLEMAS

Posibles problemas• Los problemas esperados incluyen (cont …)

– Cada gerente se siente responsable por pel o su propia área, y no hay coordinación general.

– Los gerentes de TI fallan en entender el valor agregado proporcionado por los procesos de Incident, Problem y Change Management.

– El nivel actual de disponibilidad es considerado suficiente

– No hay apoyo para designar un solo gerente responsable del proceso

– El gerente del proceso no tiene la autoridad requerida

Page 69: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management COSTOS Y POSIBLES PROBLEMAS

Posibles problemas

• Aún con suficiente apoyo gerencial, podría presentarse:

– Desestimación de recursos– Carencia de herramientas de medición y

reporteo efectivas– Carencia de otros procesos tales como

Service Level Management, Configuration Management, y Problem Management

Page 70: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management COSTOS Y POSIBLES PROBLEMAS

Posibles problemas• Si Availability Management es usado ineficientemente,

podrían surgir los siguientes problemas:– Habrá dificultad para definir estándares apropiados de

disponibilidad– Será más difícil conducir a los proveedores internos y externos– Será difícil comparar los costos de la disponibilidad contra los de

la indisponibilidad– Si no se consideraron estándares de disponibilidad durante el

diseño, podrían requerirse repetidas intervenciones para alcanzar los estándares y sería más costoso

– Los estándares de disponibilidad no serán satisfechos, lo cual puede llevar a fallas en el cumplimiento con los objetivos del negocio

– La satisfacción del cliente se verá reducida

Page 71: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management CONTROL DEL PROCESO

Factores críticos del éxito e indicadores de desempeño

• El negocio debe tener claramente definidos los objetivos y deseos de disponibilidad.

• Service Level Management debe haber sido establecido para formalizar los acuerdos

• Ambas partes deben usar las mismas definiciones de disponibilidad y downtime.

Page 72: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

ITIL-Availability Management CONTROL DEL PROCESO

Comentarios finales sobre posibles problemas• Los problemas pueden ser solventados con un buen

apoyo a la gerencia, con la persona adecuada con total responsabilidad sobre el proceso, herramientas apropiadas y una resolución rápida y efectiva de los problemas existentes.

• Esperar una excesiva alta disponibilidad es otro problema potencial.

• Los costos podrían crecer desproporcionadamente con respecto a los beneficios.

• Siempre existe la posibilidad de una caída del servicio de TI. El Availability Manager juega un rol importante en la resolución de estos eventos no deseados.

Page 73: Procesos de ITIL Availability Management Continuación … Maestro Alfonso Moreno Perdomo Marzo de 2008

FIN

Continuación …

Availability Management