Impact Voice Management
Incident Report for Axialys
Postmortem

Analyse post-mortem :

Vers 11h20 ce matin une opération administrative de routine a été conduite sur l'un des serveurs de bases de données servant notre plate-forme Voice Management. Cette opération, normalement anodine, a provoqué un fort ralentissement général du serveur concerné, impactant certains aspects du fonctionnement du bandeau opérateur.

Dans ces conditions un redémarrage du serveur concerné a été effectué. Ceci a obligé la plupart des utilisateurs de la plate-forme à initier une reconnexion. Ces nombreuses reconnexions simultanées ont à leur tour surchargé un autre composant, et un timeout trop court dans le processus de connexion a conduit à une multiplication des requêtes, surchargeant d'autant plus le système.

Ce n'est que vers midi que la situation a pu être réellement stabilisée pour tous nos clients.

Remédiation :

Plusieurs actions seront menées dans les prochains jours afin de prévenir à l'avenir la ré-occurence d'un incident similaire :

  • correction dans le processus de connexion afin d'éviter un effet "boule de neige" tel que constaté ce jour (déjà actif)
  • revue et augmentation de capacité de traitement sur la plate-forme concernée
  • revue des procédures opérationnelles afin d'éviter toute opération administrative sur les créneaux horaires les plus sensibles

Nous vous présentons nos excuses pour ce dysfonctionnement, et vous assurons de notre engagement à vous fournir un service de qualité.

Posted Apr 13, 2022 - 13:24 CEST

Resolved
L'incident est désormais effectivement clos.
Posted Jun 26, 2020 - 15:28 CEST
Monitoring
Le problème a en principe été résolu pour l'ensemble de nos clients.

Nous informons nos clients qui constateraient encore des difficultés à ouvrir ou mettre à jour un ticket de support (support@axialys.com).

Nous gardons la situation en observation. Un rapport d'incident sera établi dès que possible.
Posted Jun 26, 2020 - 12:15 CEST
Identified
Nous vous informons qu'un incident est actuellement en cours sur notre service Voice Management.

L'incident est identifié sur un cluster de base de données et est en cours de résolution.
Posted Jun 26, 2020 - 11:30 CEST
This incident affected: Voice Management - APIs and Voice Management - interfaces web.