Dicen que la solución más sencilla es aquella que no se te ocurre en el instante, y todos hemos pasado por ello cuando se trata de fallos en ordenadores, móviles o dispositivos electrónicos, donde después de tratar de investigar qué es lo que está sucediendo siempre acabamos en el clásico reinicio, una solución que funciona en el 95% de los casos.
Pero cuando eres la entidad gubernamental responsable de hacer la encuesta demográfica más importante de tu país y ésta presenta un fallo que representa millones de dólares, entonces la solución del reinicio puede que no surja como primera opción debido a un posible bloqueo derivado del estrés al que se está expuesto. Y aunque suene increíble, esto es exactamente lo que ocurrió en el pasado censo en Australia.
El reinicio de los 30 millones de dólares
El pasado 9 de agosto Australia llevó a cabo su censo nacional, el cual se realiza cada cinco años con la finalidad de obtener diversos datos demográficos del país. Para el censo de 2016 por primera vez se habilitó una página web para que los ciudadanos australianos presentaran los diversos formularios, un trabajo que estuvo a cargo de IBM y del Buró Australiano de Estadísticas (ABS).
Por alrededor de un año se hicieron pruebas y simulaciones para que el día del censo se pudiera soportar el tráfico así como para estar prevenidos en caso de algún ataque cibernético. Lamentablemente las cosas no salieron muy bien, ya que el sistema se cayó por 40 horas, lo que hizo que millones de ciudadanos no pudieran acceder a los formularios en línea, esto hizo que se extendiera el plazo para completarlo, con todo lo que conlleva, como servidores, personal trabajando las 24 horas, monitorización en tiempo real y otras tareas derivadas de esta labor.
Después de este fallo que ocasionó un retraso de casi tres días en la captura de datos, una comisión del Senado abrió una investigación para determinar responsabilidades en la caída de la web del censo así como para saber qué es lo que había ocurrido. Los resultados son más que sorpresivos, ya que la misma IBM está admitiendo que el falló pudo haberse resuelto al reiniciar uno de los dos routers que controlaban el tráfico.
Michael Shallcross, ingeniero responsable de IBM, explicó a los senadores que durante la madrugada del 9 de agosto experimentaron un ataque DDoS proveniente de Singapur, por lo que tuvieron que apagar uno de los routers para mitigar dicho ataque. Con esto tuvieron que simular el impacto de trabajar con sólo un router durante al arranque del censo y en estas pruebas todo salió bien, lo que les daría tiempo para resolver el fallo del otro router.
Pero esto no fue así, el router no soportó el tráfico y alrededor de las 7 de la noche terminó tirando la web y todo el sistema del censo, lo que hizo que el problema se hiciera más grande cuando ya era demasiado tarde. Shallcross añadió que si pudiera regresar en el tiempo hubiera probado el apagar y encender nuevamente el router, ya que esto hubiera reiniciado el sistema y cargado la configuración nuevamente de forma automática.
IBM asegura que ninguno de los datos de los ciudadanos estuvo comprometido y David Kalisch, jefe de estadística en ABS, dijo que el sistema desarrollado por IBM era "robusto y estaba listo", sin embargo durante todo el 9 de agosto no recibieron una explicación o información acerca de lo que estaba ocurriendo.
Kerry Purcell, director general de IBM en Australia, emitió una disculpa pública por el manejo fallido de la web del censo, donde admitió que nadie ha sido despedido o sancionado y actualmente está en negociaciones con John Fraser, jefe de Departamento del Tesoro Australiano, sobre costes de compensación, pero no ha sido capaz de presentar una cifra estimada.
Por su parte, ABS estima que los costes por el fallo en el censo podrían ascender a más de 30 millones de dólares. Por otro lado, expertos en seguridad aseguran que las medidas tomadas por IBM para contener posibles ataques no fueron las adecuadas, más sabiendo que era la primera vez que ponían a prueba un sistema de este tipo y estaban propensos a ataques.
David Kalisch de ABS también emitió una disculpa pública y se comprometió a que el censo de 2021 tendrá un enfoque más riguroso a raíz de lo aprendido este año.
La noticia "A Australia le costó 30 millones un fallo que pudo haberse solucionado reiniciando un router" fue publicada originalmente en Xataka.