
Jeudi dernier, OVH
connaissait 2 pannes majeures dans ses data
centers de Strasbourg (Bas-Rhin) et Roubaix (Nord). En cause, une coupure de
courant et un problème de liaison optique. Tous les services de l’hébergeur
sont rétablis ce lundi, assure le PDG d’OVH.
Jeudi dernier, une
gigantesque panne a touché le data center
d’OVH à Strasbourg (Bas-Rhin). Plus de 3 millions de sites web étaient
inaccessibles, rappelle Numerama. « Cette nuit, nous avons fixé les derniers serveurs avec le problème
matériel. Tous les serveurs sont en ligne » a déclaré lundi matin Octave
Klaba, PDG de l’hébergeur.
It remains: 18 servers.
— Octave Klaba (@olesovhcom) 12 novembre 2017
https://platform.twitter.com/widgets.js
Panne de courant et perte de liaison optique
Après le blackout vient le temps des
explications. Tout a commencé jeudi dernier vers 7 heures du matin, quand une
panne d’électricité frappe 2 centres de données (SBG1 et SBG4) situés à
Strasbourg (Bas-Rhin). Le problème vient d’une ligne EDF défectueuse, mais
aucun des groupes électrogènes n’a pris le relais. Le PDG d’OVH s’explique sur
les réseaux sociaux.
Loi des séries oblige,
une autre panne se produit à 8 heures. Cette fois, c’est le réseau optique qui
isole le centre OVH de Roubaix (Nord) des points de raccordement à Internet. Le
« bug software » entraîne
la « perte de la configuration et la
coupure de la connexion » résume Octave Klaba sur travaux.ovh.net. Résultat, une grave
perturbation des services d’OVH.
today, we have 11 teams x 3 persons each to fix the last hardware issues.
— Octave Klaba (@olesovhcom) 12 novembre 2017
https://platform.twitter.com/widgets.js
Un avion spécial pour acheminer les techniciens
L’accident à Roubaix aura
duré 2 heures et 33 minutes. « Nous avons
été obligés d’intervenir directement dans les salles de routage, pour faire les
manipulations sur les châssis (…) c’est la principale raison de la durée de
l’incident » indique OVH. Du côté de Strasbourg, de nombreux serveurs à
l’arrêt refusent de redémarrer.
En temps normal, « entre 1 et 2% des serveurs (…) ne
redémarrent pas après un arrêt électrique brutal, à cause de problèmes
matériels » précise sur Twitter Octave
Klaba.
Sur les 50.000 serveurs du data center, cela représente beaucoup de
maintenance. L’entreprise a affrété un avion entre Lille (Nord) et Strasbourg
pour transférer du personnel en renfort.
Les navettes déposent à SBG les équipes fraiches qui viennent de Roubaix et on récupère ceux qui ont tout donné. #Ovh pic.twitter.com/EEZfZ8oi12
— Octave Klaba (@olesovhcom) 12 novembre 2017
https://platform.twitter.com/widgets.js
Vers une indemnisation des clients
Un camion a aussi apporté un stock de pièces
neuves. Une fois la panne résolue, l’hébergeur doit maintenant indemniser ses clients. « Nous appliquerons les SLA (service-level agreement, NDLR) prévus dans
nos contrats » précise OVH. Les clients devront contacter l’hébergeur, qui
réglera chaque dossier au cas par cas.
Ajouter un commentaire