Hier en fin de journée, vers 17h30, je vous rapportais que le service de microblogage Twitter était indisponible pour de nombreux utilisateurs. Si je pensais qu’il s’agissait dans un premier temps d’une panne localisée, je me suis vite rendu compte avec les différents flux RSS que celle-ci était mondiale.
C’est donc presque un mois jour pour jour après son dernier incident, que le site de microblogging Twitter est tombé en panne à nouveau le jeudi, laissant des millions d’utilisateurs à travers le monde incapable de tweeter leurs pensées, avis, recommandations ou des griefs d’au moins 140 caractères.
Le site a donc été hors-ligne pendant environ deux heures. Pendant un certain temps, les visiteurs du site ont été accueillis avec le message suivant : « Twitter is currently down for <%= reason %>. Twitter is currently down for <%= reason %>« . On peut supposer qu’à ce moment la firme n’avait aucune idée quelle était la raison ou quand il pensait que le service allait être de retour. Mais, à coup sûr ce n’était certainement pas leur intention de dévoiler le code ainsi. Selon un commentaire sur le blog de Julien, ce serait lié à du code Ruby on Rails qui n’aurait pas été interprété. De plus, comme il le mentionne justement on pouvait également voir le problème au niveau du titre de la fenêtre avec le code reason.capitalize
.
Mazen Rawashdeh, Vice-Président de l’ingénierie Twitter, a une nouvelle fois réitéré ces excuses sur le blog de Twitter, sur le fait que le service ait été mis à mal, en commençant son article avec les mots : « Nous sommes désolés ».
Il a poursuivi en expliquant simplement ce qui s’est passé. Ainsi, il indique que la cause de la panne est liée à un de leurs centres de données, qui sont pourtant conçus pour être redondants. Autrement dit, quand un système tombe en panne, un système parallèle prend le relais. Or, par malchance, et ce qui était remarquable à propos de la panne d’hier, c’est que par coïncidence les deux systèmes parallèles ont été indisponibles à peu près au même moment…
C’est donc certaines parties de l’infrastructure de Twitter qui se sont écroulées sous le poids des utilisateurs. « Nous investissons dans nos systèmes de façon agressive pour éviter que cette situation se reproduise à l’avenir » a déclaré Rawashdeh sur son article, en ajoutant : « Nous nous excusons profondément pour l’interruption que vous avez eu aujourd’hui. Maintenant, essayons de rendre le service encore meilleur et plus stable que jamais ».
Il est intéressant de noter que Facebook, probablement la société la plus concurrente, a construit sa propre infrastructure pour éviter ce genre de problème…
J’imagine que la société basée à San Francisco est sur ses gardes pour éviter que le site implose ce vendredi à la suite d’un déluge potentiel de tweets lié aux Jeux Olympiques au cours de la cérémonie d’ouverture du rassemblement sportif à Londres.
Cependant, en fin de compte c’est vitale pour l’entreprise de s’assurer qu’une panne de cette ampleur ne se reproduise pas…
Vous avez également été impacté ?