Los 5 pasos que permiten la recuperación rápida de la infraestructura ti ante desastres
Administrar un data center implica tener una conciencia de negligencia constante para poder afrontar cualquier incidencia que se presente. Un plan de contingencia sólido permite recuperar rápidamente la disponibilidad, minimizar gastos y asegurar la continuidad del negocio
Como Data Center Administrator, Daniela Guerra Núñez, piensa constantemente en cuál sería el peor escenario que se pudiera presentar en una sala de datos. Actualmente, es la encargada de gestionar el centro de datos de uno de los clientes de BS2, así como de detectar posibles puntos de falla para evitar que, a corto o mediano plazo, puedan deteriorar su infraestructura TI.
“La administración de data center tiene mucho que ver con tener una conciencia de negligencia constante. O sea, cualquier decisión que se tome en torno a la sala de datos se hace siempre pensando lo peor o pensando bien en negativo. De esa forma, se está preparado para poder afrontar lo que se venga”, explica Guerra.
El data center que administra Daniela es el de una gran cadena de almacenes minoristas, por lo que sus sistemas tienen que estar siempre disponibles y, en caso de algún evento, es fundamental tener un plan de recuperación sólido y muy receptivo.
Guerra señala que “generalmente, no pasa nada, pero cuando pasa es mejor estar preparados”. Fue el caso de un incidente ocurrido en 2018 cuando se cayó por completo el data center que ella gestiona. No obstante, recalca, la recuperación fue muy rápida debido a los recursos y al buen plan de recuperación establecido.
“Se nos cayó el data center completo por doce horas debido a un incendio. Y eso significó que ninguna tienda ni almacén tenía acceso al sistema. Por lo tanto, se perdieron ventas, despachos y generó inconvenientes, pero nos demoramos muy poco tiempo en recuperar. Para un incidente de tal magnitud, se hubiese demorado un mes la reactivación de los sistemas”, indica la Data Center Administrator de BS2.
¿Está su compañía preparada para enfrentar una contingencia?
Según un estudio reciente de Forrester Research and Disaster Recovery Journal, la razón principal para mejorar las capacidades de recuperación ante desastres es mantener la disponibilidad y ser competitivo 24/7. Mientras que otro factor importante es el enfoque en la continuidad del servicio, centrándose en la comprensión de los servicios comerciales críticos.
Para realizar, o bien sea actualizar o modernizar el plan de contingencia del data center, las empresas pueden tomar en cuenta ciertos pasos:
1) Definición los aspectos vitales de la compañía: ¿cuáles son los escenarios que más le preocupan? ¿su plan actual ofrece un nivel de confianza para la recuperación o no? Definir cuáles son los sistemas críticos de la compañía y qué pasaría si dejasen de funcionar es el primer paso para establecer un programa de recuperación. La prioridad es comprender todos los servicios y su nivel de criticidad para poder planear el aseguramiento de la continuidad.
2) Análisis y eliminación de riesgos: en esta etapa se requiere un estudio exhaustivo y un análisis minucioso de las vulnerabilidades y riesgos potenciales que pueden ocasionar una incidencia, como posibilidad de inundación o incendio, instalaciones precarias, controles de acceso ineficientes, entre otros. Una vez recabada esta información, el objetivo será eliminar las amenazas y se ejecuten las mejoras necesarias para resguardar a la organización.
3) Elaboración de la estrategia de recuperación: conociendo los sistemas críticos, es posible establecer la estrategia idónea para la empresa. En esta definición, se deben incluir aspectos como el lugar de alojamiento de la infraestructura de contingencia (en el mismo sitio, lugar secundario, etc.) y la solución a implementar (hot site, warm site, cold site, virtualización, etc.).
4) Desarrollo del plan: cumplidos los pasos previos, es el momento de implementar el plan de recuperación ante desastres. En este plan debe estar definido los responsables de declarar la contingencia, cuáles son las situaciones que se consideran como desastre, descripción de los procesos de recuperación y los procedimientos a ejecutar.
5) Pruebas y actualización: una vez implementado el plan, es importante que se realicen pruebas para verificar la efectividad del mismo. Asimismo, es necesario que se comprenda que las amenazan surgen todos los días, por lo que la actualización y el mantenimiento del plan deben realizarse continuamente.
La interrupción de los sistemas y las fallas en las funciones críticas pueden ser realmente ser letales para el negocio, dejando a la empresa en una desventaja competitiva, perdiendo credibilidad y mucho dinero.
En este punto, queda claro que para que las operaciones se realicen bajo estándares altos, la recuperación ante desastres es parte vital de la administración de los centros de datos, y requieren tiempo y recursos. Por ello, BS2 ayuda a las organizaciones a proteger su infraestructura TI realizando una auditoría general de los procesos de gestión y de los facilities instalados, con el fin de detectar posibles puntos de falla, siempre enfocados en asegurar la continuidad operacional del negocio.
Para más información contactar a: soluciones@bs2.cl