Interrupción en servicios en la nube

AWS normaliza servicios tras “problema operativo” que provocó caídas masivas en apps y webs

AWS
photo_camera AWS
Amazon Web Services informó que sus plataformas muestran una recuperación significativa y vuelven a operar con normalidad para la mayoría de clientes, tras un incidente concentrado en US-EAST-1 (Virginia) que elevó errores y latencias en múltiples servicios. Medios y el propio tablero de estado reportaron señales claras de recuperación a lo largo de la mañana, después de aplicar mitigaciones.

Qué pasó y por qué importa
En la madrugada del lunes (hora europea), AWS registró un “aumento de errores y latencias” que afectó a servicios críticos y derivó en caídas o degradaciones en aplicaciones de gran escala (banca, mensajería, juegos y comercio electrónico). La incidencia se centró en US-EAST-1, región neurálgica del tráfico global en la nube.

Restablecimiento del servicio
Tras implementar medidas de mitigación, AWS comunicó “signos de recuperación” y, posteriormente, que la mayoría de peticiones empezaban a procesarse con éxito, con trabajo residual para limpiar colas y normalizar totalmente algunos componentes. Coberturas en tiempo real corroboraron la vuelta a la operatividad.

Causa preliminar
Actualizaciones técnicas apuntaron a un problema de resolución DNS en el endpoint de las APIs de DynamoDB en US-EAST-1, con efecto cascada sobre otros servicios dependientes. La investigación de raíz de causa continúa. 

Alcance del impacto
El incidente afectó a plataformas como Snapchat, Fortnite, Roblox, Coinbase, Venmo, Robinhood, Alexa/Prime Video y a portales públicos y bancarios en el Reino Unido (HMRC, Lloyds, Halifax, BT). La amplitud reavivó el debate sobre la concentración de cargas en pocas regiones y proveedores.

Comentarios