mantenimiento del data center - ecotec.edu.ec
TRANSCRIPT
Mantenimiento del Data Center
Ricardo Coronel Jaramillo
Agosto del 2015
Mantenimiento ¿Por qué? ¿Para qué?
Así como un carro necesita cambios de aceite, cambio de llantas, revisiones en el motor y si el dueño del carro lo omite puede fundir la máquina.
El data center, como el carro, es una infraestructura técnica con equipos de precisión que debe operar 24/7 y requiere un mantenimiento integral para garantizar su funcionamiento, evitar interrupciones en el servicio, pérdidas económicas.
El mantenimiento es un proceso fundamental que reduce costos y riesgos.
Los dueños y responsables de los Data
Center saben que guardan información
crítica de las empresas, pero suelen alegar
falta de tiempo y de presupuesto para
aplicar procedimientos de mantenimiento.
Sin embargo, los riesgos que corre una
infraestructura sin revisiones pueden
tener un costo muy alto: deterioro de los
equipos, fallas constantes, cortocircuitos,
obstrucciones y colapso.
Una investigación de la consultora
Gartner determinó que entre el 20 y 30%
del origen de fallas en Data Centers se
deben a problemas en el hardware,
software y telecomunicaciones por falta
de mantenimiento.
¿A qué equipos debe hacerse
mantenimiento?
Los Data Center están conformados por
equipos eléctricos e informáticos que deben
funcionar siempre. Esto quiere decir que,
para evitar su deterioro, todo lo que esté en
la infraestructura debe recibir revisiones,
verificaciones y mantenimiento.
Pueden parecer procesos tediosos, pero son
pequeños pasos que sirven para evitar
problemas mayores.
Los técnicos y expertos deben hacer
revisiones periódicas y mantenimiento a
todos los sistemas: red, servidores,
iluminación, almacenamiento,
climatización, distribución de energía,
control de incendios, controles de acceso,
enfriadoras, grupo electrógeno, cableado
eléctrico y de datos, suelo técnico y
sistemas de alimentación ininterrumpida
Sugerencias en las revisiones de los
equipos
Mantenimiento de RED: revisión del
funcionamiento de routers, switches, señal
de proveedor de internet y cableado. Esto
implica inspección de configuración y la
disposición y distribución de los cables.
Climatización: Revisión periódica de
equipos de aires acondicionados y
enfriadores.
Control de accesos: revisión del Circuito Cerrado de TV: cámaras, tarjetas, vídeos, equipos audiovisuales en general.
Sistema de Alimentación Ininterrumpida (SAI): Debe comprobarse la estabilidad y el estado de la carga de la batería, comprobación de todos los indicadores de la UPS, comprobación y calibración de los valores eléctricos, comprobación y ubicación de ambientes de trabajo de los equipos, control de stock de repuestos.
Grupo electrógeno: Se recomienda el mantenimiento preventivo del motoralternador cada 3 meses, si el grupo electrógeno se usa solo en emergencia. En caso de que permanezca en uso continuamente se sugiere un mantenimiento cada 250 o 500 horas, dependiendo de la marca. En el motor debe revisarse el aceite y los filtros de aceite, las correas de elementos auxiliares, sistema de refrigeración y cambiar el filtro del combustible. También hay que hacer una comprobación de carga y recambiar el rodamiento del alternador.
Hacer la limpieza técnica de salas de
sistemas, hardware, sistemas de energía,
superficies verticales y periféricas y del
suelo técnico minimiza el riesgo de
propagación de elementos contaminantes
(polvo, material férrico, “pelos de zinc”)
que puedan generar sobrecalentamiento
en los equipos o dificultar el flujo del aire
en la sala.
Tipos de mantenimiento
En todos los casos el objetivo es reducir
riesgos técnicos y económicos. Los
encargados de Data Center deben tener
en cuenta las dimensiones de sus equipos
y determinar qué servicio quieren
contratar.
La recomendación es siempre asesorarse
con empresas especializadas en
mantenimiento de Data Center.
Preventivo
Son los procedimientos que persiguen
alargar la vida útil de los equipos y reducir
posibles fallas. Implica inspecciones y
detección de posibles problemas antes de
que se presenten.
Como reemplazo de piezas, ajustes,
limpieza de filtros de agua y aire y revisión
general de la estructura física.
Predictivo
Se hace en los equipos de tecnologías no
invasivas y en los que se puede predecir
que tendrá un fallo intermitente.
Correctivo
Se hace cuando ya se ha producido la avería fallo y el equipo o equipos han dejado de funcionar o están dañados. Su objetivo es detectar, identificar y reparar el fallo.
Existen diferentes dos tipos de mantenimiento correctivo: no programado y programado.
En el no programado la avería surge inesperadamente y es preciso solucionarla de forma inmediatamente.
En el programado se corrige el fallo de forma planificada y sin interrumpir el funcionamiento del sistema.
Estrategia de Mantenimiento
Definir las metas del programa de
mantenimiento: Con qué se quiere cumplir.
La seguridad está primero, asegurarse de que
el personal del Data Center conozca los
procedimientos de seguridad a seguir
durante las actividades de mantenimiento.
Organización y planificación, asegurarse de
seguir un calendario para los procedimientos
y de que se cumpla la regularidad.
Tener la documentación al día, referencias,
garantías, historial de mantenimiento y
datos, métrica, etc.
Seguir y revisar las recomendaciones que
da el fabricante para procesos de
mantenimiento y de operaciones.
Realizar pruebas rutinarias del
comportamiento de los equipos, test de
emergencia.
Asesorarse con expertos en la materia, Buscar ayuda cuando la necesite y aceptar sugerencias.
Mantener al departamento de administración de la empresa al tanto del proceso de mantenimiento.
Crear un inventario y mantenerlo actualizado. No se puede hacer el mantenimiento de aquello que no se sabe que se tiene. Hay que identificar todas las piezas y equipos de la instalación.
Asignar prioridades de mantenimiento. Hay actividades más importantes que otras, deberá determinarse cuáles son y así podrá saber qué debería hacerse en caso de problemas.
Asignar las tareas. Designar los trabajos al personal cualificado.
Externalizar si es necesario. Se debe contemplar una parte del presupuesto para contratar especialistas en mantenimiento. El riesgo de hacerlo mal es muy alto.
Tener un sistema de monitorización y
control de todo el mantenimiento que se
haga.
Solicitar un informe detallado de lo que
se ha hecho y de lo que se hará en el
próximo programa de mantenimiento.
Conclusión
El mantenimiento es un procedimiento ineludible, se hace para evitar fallas y sus beneficios económicos son enormes, considerando las pérdidas que generan las interrupciones no programadas. Se debe considerar como una inversión y no como un gasto.
Permite que los equipos funcionen con eficiencia, reducen los costos de reparación de incidentes e interrupciones, mejora la disponibilidad, la rentabilidad y evita que pequeños problemas se conviertan en verdaderas catástrofes en el Data Center.
No esperar a que ocurra un incidente y
cuestionarnos:
“¿Por qué no hice el mantenimiento?”