Chers clients,
Nous vous prions de trouver ci-après l’analyse post-mortem de l’incident de ce matin.
Un de nos serveurs de téléphonie a subi une panne durant la nuit de samedi à dimanche. Cet équipement fournit du service à environ 15% de nos clients. Il est secouru par un second équipement, situé sur un second site technique. Cette panne n’aurait donc pas dû être visible par nos clients, et nous n’avons donc pas mobilisé de technicien pendant la nuit.
Néanmoins, nous avons été alertés par quelques clients dimanche matin de problèmes de téléphonie. Il s’est avéré que ces clients utilisaient pour la plupart notre système de téléphonie WebRTC (dans le navigateur).
Notre investigation a mis en lumière un défaut dans le mécanisme de redondance, faisant que ces clients n'étaient pas basculés sur le serveur de secours (contrairement à ceux utilisant des postes physiques).
C’est donc seulement vers 11h ce dimanche matin que, du fait de l’intervention de notre technicien, la situation a pu revenir à la normale pour les clients impactés.
Nous allons dans les tous prochains jours corriger et re-valider nos scénarios d’incident dans un tel cas, afin de s’assurer qu’un tel dysfonctionnement ne puisse se reproduire.
Nous renouvellons nos excuses à ceux de nos clients qui ont été impactés.