Un bug en la automatización de DynamoDB fue la causa de la última gran caída de AWS

Un bug en la automatización de DynamoDB fue la causa de la última gran caída de AWS

por Edgar Otero

Amazon ha publicado un informe bastante detallado sobre la interrupción masiva de sus servicios (AWS) que tuvo lugar el pasado 20 de octubre. La caída, que dejó inaccesibles numerosas páginas web, aplicaciones y juegos, tuvo su origen en un bug en su software de automatización DynamoDB, donde sus clientes de AWS almacenan datos. Hay que recordar que los servicios en la nube de Amazon dan vida a gran parte de Internet, con sus GPU NVIDIA H100 y sus chips de IA personalizados fabricados por Intel.

El informe explica que este fallo inicial desencadenó problemas en cadena en otros sistemas de Amazon Web Services que dependen de dicho software. DynamoDB, que gestiona cientos de miles de registros DNS, está diseñado para solucionar cualquier incidencia de forma automática. Pero parece que esta no fue así.

Un fallo en cadena que requirió intervención manual

Según explica la compañía, un error en el sistema de gestión de DNS de DynamoDB provocó que se generara un registro DNS vacío para los centros de datos de Amazon en Virginia del Norte. El problema se agravó cuando el mecanismo de reparación automática, que debía haber corregido este error, falló. Esto obligó al personal de Amazon a tener que solucionar el problema de forma manual. Mientras la incidencia estaba activa, todos los sistemas que necesitaban conectarse a DynamoDB no pudieron hacerlo y experimentaron fallos de DNS.

La lista de servicios afectados fue extensa e incluyó a la propia Amazon, sus dispositivos Alexa, Bank of America, Reddit, Canva, Snapchat, Disney+, Apple Music, Fortnite, PlayStation y Lyft, entre muchos otros. Tal y como recogen en Engadget, incluso afectó a productos conectados, como camas inteligentes, que se conectan a Internet para ajustar su temperatura. Algunos de estos servicios respondían con lentitud, mientras que otros quedaron completamente inaccesibles. Sin duda, un doloroso recordatorio de la dependencia de estos gigantes de cloud.

Fin del Artículo. ¡Cuéntanos algo en los Comentarios!

Temas Relacionados: Cloud Amazon AWS
Redactor del Artículo: Edgar Otero

Edgar Otero

Soy técnico en sistemas informáticos, empecé a experimentar un Pentium II, aunque lo mío siempre ha sido el software. Desde que actualicé de Windows 95 a Windows 98 no he dejado de instalar sistemas. Tuve mi época Linuxera y fui de los que pidió el CD gratuito de Canonical. Actualmente uso macOS para trabajar y tengo un portátil con Windows 11 en el que también he instalado Chrome OS Flex. En definitiva, experimentar, probar y presionar botones.

Comentarios y opiniones sobre: Un bug en la automatización de DynamoDB fue la causa de la última gran caída de AWS ¿Qué opinas? ¿Alguna pregunta?