Caída masiva y global de Amazon Web Services que daña a webs y apps

Una incidencia que ha dejado a miles de servicios con errores intermitentes
Amazon Web Services

Mañana complicada en internet. Desde primera hora de este lunes, Amazon Web Services (AWS) —la mayor plataforma de computación en la nube del planeta— ha sufrido una incidencia que ha dejado a miles de servicios con errores intermitentes: páginas que no cargan, apps que no inician sesión, asistentes que “no escuchan” y juegos en línea que no conectan con sus servidores. El alcance ha sido global y transversal.

Según el panel de estado de AWS y los primeros reportes de prensa tecnológica, el problema ha provocado aumentos de latencia y errores en varias regiones, con impacto en decenas de servicios de la propia plataforma. Entre los afectados se han contabilizado herramientas populares, plataformas sociales y títulos de gaming masivo como Roblox o Fortnite, además de productos del propio ecosistema de Amazon como Alexa.

Aunque la compañía no ha publicado aún un parte técnico definitivo, las primeras explicaciones apuntan a un incidente relacionado con componentes críticos de backend, con menciones específicas a Amazon DynamoDB (la base de datos NoSQL de AWS) y a picos de error en infraestructuras de la costa Este de EE. UU., una de las zonas neurálgicas de la nube de Amazon. Cuando una pieza de ese tamaño falla, el efecto dominó es inmediato: servicios que dependen de esa base de datos dejan de responder o lo hacen con mucha lentitud, y las aplicaciones cliente “se caen” aunque su código esté correcto.

¿Qué se ha visto desde el lado del usuario?

  • Errores de inicio de sesión y pantallas en blanco en apps móviles y web.

  • Cortes en streaming, juegos y bots que requieren comunicación constante con la nube.

  • Asistentes de voz que responden con “no puedo procesar tu solicitud ahora mismo”.

Monitores independientes como Downdetector han registrado miles de avisos en la franja de 9:00–11:00 (hora peninsular), con picos asociados a AWS y, en cascada, a servicios que la utilizan.

¿Cómo reacciona AWS en estos casos?

El procedimiento habitual incluye tres fases: mitigación (desviar tráfico, reiniciar componentes y aplicar “throttling” controlado), restauración (volver a niveles normales de latencia/error) y post-mortem público con la causa raíz y medidas preventivas. A media mañana, AWS ya informaba de una mejora progresiva en varias regiones, con restablecimiento paulatino de funcionalidades en los servicios más afectados. La experiencia de usuario, eso sí, puede seguir siendo irregular durante un tiempo: caches que se rehacen, colas que se vacían y reintentos desde los clientes. Salud AWS+1

¿Por qué una caída de AWS “rompe” tantos servicios a la vez?

Porque gran parte de internet vive hoy en nubes públicas. Empresas de todos los tamaños subcontratan infraestructura (servidores, bases de datos, colas de mensajes, balanceadores…) para desarrollar más rápido y a menor coste. La contrapartida es una dependencia sistémica: cuando un proveedor hiper-concentrado tiene una incidencia, el impacto se amplifica. La buena noticia es que estas plataformas cuentan con equipos de SRE y mecanismos de resiliencia muy sofisticados; la mala, que la complejidad de sus arquitecturas hace inevitables los incidentes puntuales.

¿Qué puedes hacer si tu servicio sigue fallando?

  1. Reintenta más tarde y evita acciones repetitivas (no mejores las cosas machacando el botón).

  2. Comprueba canales oficiales de la app que usas y el panel de estado de AWS antes de borrar datos o reinstalar.

  3. Si gestionas un servicio afectado, informa a tus usuarios con transparencia y desactiva temporalmente funciones no críticas para aliviar carga.

La incidencia de hoy deja, una vez más, una lección ya conocida: la nube es potentísima, pero no infalible. En un mundo cada vez más apoyado en servicios distribuidos, las estrategias de redundancia multirregión o incluso multicloud no son un lujo, sino un seguro de continuidad. AWS, por su parte, deberá detallar en las próximas horas qué ocurrió exactamente para que medio internet empezara el día con el pie izquierdo.

Comentarios