3 consejos para evitar caídas en el servicio de tu centro de datos

caida centro datos

En agosto de 2013, solo 5 minutos de caída en el servicio de Google provocaron que el tráfico global se redujera en 40% y la compañía perdiera 500,000 dólares de acuerdo con la analista de Forrester, Rachel Dines.

Sin embargo, todo ha cambiado sobre todo en las áreas de TI donde los avances evolucionan a pasos agigantados, las necesidades del cliente son cada vez más específicas y los centros de datos son pieza clave para el funcionamiento de los negocios.

Por ejemplo, la más reciente caída de los servicios de Facebook en octubre de 2021 representó para la compañía pérdidas de más de 6 mil millones de dólares en sólo 6 horas, según estimaciones de Netblocks. Además, afectó negativamente el precio de la compañía en NASDAQ y el Bloomberg Billionaires Index del que su CEO, Mark Zuckerberg, forma parte.

Y sí, aunque en este caso la caída de Facebook, WhatsApp e Instagram no estuvo relacionada con alguna falla en la infraestructura de su centro de datos, nos permiten tener un parámetro de lo que unos minutos de interrupción significan hoy. 

Foto de Freepik

EL COSTO DE INACTIVIDAD DEL DATA CENTER

La función principal de los Data Center es proporcionar un tiempo de actividad constante para las aplicaciones de misión crítica que alberga. Y aunque cada vez es más común que las organizaciones presten especial atención en ellos, no siempre se es consciente de los costos que una vulnerabilidad en la infraestructura o una falla total en el sistema podría tener. 

El tiempo de inactividad es caro. 

Si pensamos exclusivamente en la parte económica, los datos de Gartner muestran que 1 minuto de inactividad cuesta cuesta $5,600 dólares, lo que en horas representa entre $540 y $140,000 dólares de pérdidas dependiendo de la organización.

Pero eso no es todo. Vivimos en un mundo conectado, por lo que descuidar la continuidad de las operaciones del centro de datos también afecta la experiencia de los clientes e impacta directamente la credibilidad y  reputación de la marca.

Foto de Freepik

Un caso reciente de crisis de reputación por caída del sistema fue el que enfrentó Bancomer en el mes de septiembre de 2021, cuando 24 millones de clientes no pudieron acceder a su dinero por casi 20 horas. 

La indignación y reclamo de los usuarios fue tal que exigieron que el banco fuera sancionado por la Comisión Nacional Bancaria y de Valores (CNBV) para que resarcieran las afectaciones.

¿Qué tan frecuentes son las interrupciones del centro de datos?

Según un estudio de SUSE, empresa pionera en software de código abierto, hasta 2015 se podía esperar que un negocio sufriera por lo menos una caída de su centro de datos en el año.

En la actualidad, los datos de la encuesta 2021 de Uptime Institute sobre las interrupciones en los centro de datos y sus causas, muestran que el número de cortes ha disminuido. Sin embargo, las consecuencias por la inactividad en los sistemas críticos cada vez son peores.

Durante 2020, el 69% de los propietarios y operadores de centros de datos entrevistados aseguró haber experimentado algún tipo de interrupción. Si bien, en más de la mitad de los casos los tiempos de inactividad fueron fugaces y tuvieron pocas consecuencias; la mitad restante dijo haber enfrentado daños operativos, financieros y de reputación.

De hecho, los encuestados revelaron que el 62% de las interrupciones clasificadas como importantes, graves o muy graves costaron más de $100,000 dólares (un 56% más que en 2020). Además, hubo un 15% que costaron más de $ 1 millón de dólares.

Afortunadamente, el mismo estudio de Uptime Institute dejó ver que si bien el número total de interrupciones de los centros de datos aumentó en comparación con años anteriores [de hecho, en 2020 la pandemia de Covid-19 fue la principal responsable de los patrones cambiantes de las caídas], esta tasa de crecimiento está siendo superada por la tasa de expansión de la infraestructura de TI, lo que significa que las instalaciones individuales pueden estar experimentando menos incidentes. 

¿POR QUÉ OCURRE UNA CAÍDA DEL SISTEMA?

Si bien la frecuencia de las caídas, puede ser preocupante para los gestores de centros de datos e industria tecnológica en general, conocer las causas puede llevarnos a entender mejor cómo suceden estas caídas y facilitar la búsqueda de soluciones más efectivas para reducirlas y prevenirlas.

Según Uptime Institute, hay 3 factores que provocan más del 50% de todas las interrupciones que puede sufrir un centro de datos:

  1. Fallo en los sistemas de energía ininterrumpible (UPS)

Estos dispositivos ofrecen alimentación eléctrica cuando hay algún fallo en la red, ayudan a proteger los equipos y a mantener la continuidad de las operaciones. Por eso, es importante revisar que su funcionamiento sea óptimo para cumplir con su misión de forma efectiva.

2. Cibercrimen

Otro factor clave en la caída del sistema de un centro de datos son los ciberdelincuentes que logran filtrarse en los sistemas. Y, aunque los administradores toman todo tipo de precauciones para evitarlo, lo cierto es que el aumento de robo de información y datos sensibles cada vez es más frecuente. 

Esto va de la mano con los constantes avances tecnológicos actuales y la necesidad de las personas por integrarlos en su vida cotidiana.

Foto de Pexels

3. Errores o accidentes humanos

Resultados recientes muestran que el 79% de las interrupciones del centro de datos se atribuyen directamente a la ineficacia del personal a cargo o a la falta de implementación de buenas prácticas de operación y gestión del mantenimiento del data center. Otros factores que afectan la disponibilidad del centro de datos en 2021 son las fallas de enfriamiento, errores de software o del sistema y problemas de red.

¿CÓMO PREVENIR UNA CAÍDA EN LOS SERVICIOS DEL CENTRO DE DATOS?

Los fallos en la infraestructura pueden controlarse y prevenirse de muchas formas. Dar prioridad a estas recomendaciones puede ayudar a evitar estas caídas y minimizar el riesgo de pérdidas económicas.

  • Acceso y monitoreo de la infraestructura 

Es necesario revisar cada parte de la infraestructura del data center en búsqueda de posibles vulnerabilidades físicas que puedan ocasionar una caída. Por ejemplo, revisar constantemente el sistema de enfriamiento puede ayudar a prevenir niveles de humedad inadecuados que se traducen en un funcionamiento ineficiente del centro de datos.

Al hacer el monitoreo es importante tomar en cuenta aspectos como, la red eléctrica, los sensores de temperatura, el nivel de humidificación, servidores, etc.

  • Monitoreo de las baterías UPS

Uno de los errores más comunes es no revisar la condición  de las baterías del UPS. Aún cuando estos dispositivos ofrecen confiabilidad y respaldo a tu centro de datos, si no hay un monitoreo constante, errores como éstos pueden causar impactos financieros considerables a tu negocio. 

  • Mantenimiento preventivo

Al igual que el monitoreo, llevar un adecuado programa de mantenimiento puede ayudar a prevenir el riesgo de interrupción. 

Cualquier servicio de tecnología necesita ir acompañado de un buen servicio de mantenimiento a través del cual se puedan atender específicamente todos los componentes de la sala. 

El objetivo de realizar un mantenimiento constante y programado, es lograr superar el tiempo de vida útil de toda la infraestructura .

  • Capacitación del personal y mejores prácticas

Tres de cada cuatro propietarios y operadores de centros de datos aseguraran que su interrupción más reciente se pudo prevenir con un protocolo de gestión y procesos más eficientes, esto de acuerdo con un estudio del UpTime Institute de 2021. 

Implementar lo anterior no solo asegura la disminución de la probabilidad de fallas o errores humanos, sino que también ayuda a predecir futuros fallos y a prepararse de forma natural para las interrupciones no planeadas que puedan ocurrir.

¿SE PUEDE OPERAR CON CERO INTERRUPCIONES?

Hoy en día, muchas empresas optan por implementar tecnología para posicionar, vender, y/o diversificar sus productos y servicios de mejor manera en el mercado. La demanda sigue subiendo y acelerará su ritmo en los próximos años.

De hecho, de acuerdo con Statista, a pesar de la recesión que experimentó la industria de TI en 2020 debido la pandemia del coronavirus (COVID-19), se espera que el gasto en sistemas de centros de datos ascienda a 207 mil millones de dólares estadounidenses en 2022. 

Information technology (IT) spending on data center systems worldwide from 2012 to 2022 (in billion U.S. dollars)

Fuente: Statista

Es por eso que, para mejorar la experiencia del usuario y rentabilidad de los negocios; un claro objetivo es tener cero interrupciones en el sistema. 

En ese sentido, quiénes nos dedicamos al diseño, mantenimiento y construcción de centros de datos e infraestructura tecnológica tenemos una tarea muy importante; garantizar la continuidad y la eficiencia de estos negocios para ayudarles a capitalizar todo su potencial de mercado.

En ATN podemos ayudarte a mantener tu operación continua y evitar interrupciones en tus sistemas.

Solicita una asesoría sin costo aquí: https://atn.com.mx/contacto/

Compartir
Share on facebook
Share on twitter
Share on linkedin
Share on whatsapp
Share on email

2 respuestas

    1. Hola, Alejandra.

      Nos alegra saber que te pareció interesante, gracias por leernos y dejarnos tu comentario.

      Si quieres seguir aprendiendo sobre temas relacionados, te invitamos a suscribirte al blog para no perderte las próximas entradas.

      ¡Nos leemos pronto!

      Saludos,
      Equipo ATN

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Artículos relacionados