El día en que se paró el mundo

Artículo CIO Advisory Sourcing Advisory

El 19 de julio, una actualización fallida de CrowdStrike causó una caída global de servidores, afectando muchos servicios, incluidas las operaciones aéreas. Este incidente subraya la importancia de tener un Plan de Continuidad de Negocio bien definido para gestionar amenazas como caídas de servidores, ciberataques y la indisponibilidad de aplicaciones. Un Plan de Recuperación ante Desastres (DRP) adecuado podría haber permitido a las empresas continuar operando durante el incidente, evitando interrupciones significativas y daños reputacionales.

¿Recuerdas ese 19 de julio en el que estabas a punto de coger un avión a las Maldivas?  Tuviste que quedarte en tierra durante un día. Seguramente te perdiste un emocionante baño con tiburones. 
La culpa no fue de la aerolínea. Podrás enfadarte con ellos si no te ofrecieron comida en el vuelo, pero el problema era de un sistema de seguridad. 
CrowdStrike sufrió una caída debido a una mala actualización, dejando inhabilitados miles de servidores a nivel mundial. 
Pero ¿esto es normal? ¿Cómo puede ser que nadie detectará el error? ¿Por qué no hicieron nada para solucionarlo? 
 
La respuesta está en la Continuidad de Negocio.  Todas las empresas deben contar con un plan ante amenazas de cualquier tipo: caída de servidores, ciber-ataques o la indisponibilidad de aplicaciones, personas o edificios. 
Quizás te preguntes qué tiene que ver esto con una actualización de software, pero está completamente relacionado. Si un sistema no funciona, necesitas tener otros sistemas listos para dar soporte, sobre todo si prestas un servicio crítico. ¡Nadie quiere ver caer aviones! 

¿Qué hubiera pasado si CrowdStrike hubiera aplicado su Plan de Continuidad de Negocio?

Hubieran informado a sus clientes de forma estructurada y pautada sobre la situación. Con un procedimiento cerrado en el cual es más fácil controlar las amenazas, evitando así costes reputacionales, operativos y económicos, tanto para la firma como para sus clientes. 
Ante estas situaciones las empresas deben contar con un plan de continuidad bien definido. Este plan debe incluir estrategias y escenarios que ayuden a proteger procesos críticos. 
Si esos procesos críticos se ven amenazados, hay que aplicar estrategias para minimizar los daños y controlar el tiempo de interrupción del servicio. De esta manera, se protege la imagen de la empresa. 

Muy bien, pero una vez afectado el proceso, ¿qué hacemos?

Tal y como sucedió en este caso, muchas empresas no implementaron correctamente sus planes de recuperación de procesos. Olvidaron aplicar el Disaster Recovery Plan (DRP), de esta manera podrían seguir operando sus servicios sin problemas, hasta solucionar el incidente y recuperar la normalidad. De no tener un DRP correctamente definido, podemos sufrir situaciones como la vivida el pasado verano. 
En una sociedad tecnológica en la que las actualizaciones son el pan de cada día, muchas veces nuestros dispositivos se actualizan sin que nos demos cuenta. Pero cuando se trata de un servicio crítico, esas actualizaciones deben venir pautadas y validadas por un departamento de Calidad, el cual da por buena la actualización y asegura que no supone ningún riesgo para la entidad. 
En este caso en especial se tuvieron que actualizar cientos de ordenadores manualmente. 
Por lo que sí, todo volvió a la normalidad, pero tú te quedaste en tierra sin saber muy bien por qué. 
Entonces respondiendo a tu pregunta de quién debe de devolverte esa experiencia con tiburones que tuviste que perderte, ya que CrowdStrike no activó la situación de contingencia y los clientes tampoco entonces ¿De quién crees que es la culpa?




Sina Asghari
By Sina Asghari
Sourcing and Cybersecurity Consultant

27 Ene 2025
Knowledge Hub overview