Une nuit mouvementée...
Ecrit par Jerome Pietri le
Cette nuit nous étions 5 sur le pont, réveil difficile en pleine nuit. Quoiqu'il en soit Greg / PIerre-Laurent / Dumè / Seb et moi même étions debout à 2h du mat jusqu'à 4h suite un incident BGP.
Quand le BGP tombe en panne
La principale particularité d'Internet est d'être un réseau capable de se reconfigurer seul en cas de rupture d'une connexion. Cette fonctionnalité, héritée de la jeunesse militaire du réseau, visait à lui permettre d'être toujours fonctionnel. Pour se faire, chaque routeur annonce à ceux avec qui il communique la liste des réseaux qu'il est capable d'atteindre ou de gérer : C'est le protocole BGP (Border Gateway Protocol).
Dans la nuit de Mardi à Mercredi, notre fournisseur réseau OVH a réalisé une maintenance sur ses routeurs consistant à retirer de ceux-ci les règles BGP obsolètes ou devenues inutiles. Gregory Giannoni commente :
"Il est des grandes pannes réseau comme des enquêtes de police, et il est difficile d'avoir les détails tant que l'affaire n'est pas close, mais le ménage réalisé dans les configurations des routeurs a été un peu trop corrosif, si bien que les chemins informatiques menant à nos réseaux ont été supprimées, isolant ainsi nos serveurs du reste du monde."
Pierre Laurent Medori qui ne s'est toujours pas couché, acquiesce !
Il aura fallu une heure en pleine nuit pour que le système soit à nouveau en grande partie fonctionnel, mais il reste encore à l'heure actuelle quelques problèmes de connectivité avec certains fournisseurs d'accès où quelques pays, et les problèmes sont en cours de résolution. Nous sommes toujours en contact étroit avec le support housing de notre fournisseur.
"Il est des grandes pannes réseau comme des enquêtes de police, et il est difficile d'avoir les détails tant que l'affaire n'est pas close, mais le ménage réalisé dans les configurations des routeurs a été un peu trop corrosif, si bien que les chemins informatiques menant à nos réseaux ont été supprimées, isolant ainsi nos serveurs du reste du monde."
Pierre Laurent Medori qui ne s'est toujours pas couché, acquiesce !
Il aura fallu une heure en pleine nuit pour que le système soit à nouveau en grande partie fonctionnel, mais il reste encore à l'heure actuelle quelques problèmes de connectivité avec certains fournisseurs d'accès où quelques pays, et les problèmes sont en cours de résolution. Nous sommes toujours en contact étroit avec le support housing de notre fournisseur.
Maintenance matinale
Et oui nous avions également une maintenance matinale programmée de 7h à 10h qui n'avait rien a voir. Nous avons hésité en pleine nuit a l'annuler mais il fallait la faire, elle s'est bien passé et s'est terminée à 9h30. Il s'agit de deux choses bien distinctes: la maintenance n'a rien a voir avec la panne, et s'est bien déroulée.