A las 3:40 p.m., se recibieron reportes de un bloqueo general en todas nuestras plataformas (VIVO, eCommerce y Operacional). Esto provocó la imposibilidad de:
El incidente comenzó a las 2:58 p.m., cuando el servicio de Google BigQuery experimentó altas latencias en la ingesta y edición de datos en la nube. Esto generó bloqueos en nuestra base de datos principal, donde se almacena la información crítica de nuestras plataformas.
Los bloqueos iniciales provocaron encolamientos, lo que activó alertas en nuestros sistemas y derivó en el bloqueo total de las plataformas.
Adicionalmente, los usuarios de las operaciones intentaron acceder repetidamente al sistema, lo que resultó en bloqueos automáticos de direcciones IP, especialmente en las bodegas. Estos bloqueos de IP están diseñados para prevenir ataques cibernéticos masivos.
El equipo de Ingeniería y Arquitectura:
El servicio fue completamente restaurado a las 4:56 p.m.
Este incidente tuvo un alcance global, afectando operaciones en Colombia, México, Brasil, Chile y Venezuela. Durante los 76 minutos de interrupción (de 3:40 p.m. a 4:56 p.m.):
Link:
Falla Google BigQuery Cloud https://status.cloud.google.com/incidents/LztMRFrCwWofMbzRENLW