Centurylink/Level3 legt het halve internet plat

fibre optic.jpg

Een grote storing bij de Amerikaanse provider CenturyLink (vroeger gekend als Level3) veroorzaakte zondag wereldwijd internetproblemen. Hoe kan het dat een probleem bij één provider zo'n grote impact heeft?

Twee redenen:

  • CenturyLink is niet zomaar een provider. CenturyLink beheert het grootste netwerk van de wereld en komt in contact met zo goed als ieder ander netwerk in deze wereld. We noemen dit een "tier-1 operator".
  • Tijdens het incident gisteren hebben ze er een onvoorstelbaar boeltje van gemaakt, waardoor de impact veel groter en veel langer was dan je zou verwachten.

Hoe werkt het internet eigenlijk?

Het internet bestaat uit duizenden aparte netwerken die aan elkaar verbonden zijn. Eigenlijk moet je het internet zien als 1 gigantisch netwerk, volledig willekeurig met elkaar verbonden met glasvezelkabels. Er liggen kabels in de grond, onder de zee, …

Maak gerust de vergelijking met de echte wereld. Je hebt landen, steden, gemeenten, gehuchten, dat zijn de netwerken. Paden, straten, autosnelwegen, … zijn de netwerkverbindingen.

Als je van de ene plek naar de andere plek wil geraken heb je een route nodig. Dat is op het internet niet anders. Om het verkeer te regelen heb je bovendien iemand nodig die de weg kent, dat noemen we een router. Routers volgen verkeersregels, verzameld in een protocol, het Border Gateway Protocol (BGP).

BGP is een beetje de GPS van de internetwereld. Het past zich constant aan aan de situatie en berekent automatisch de beste routes voor jouw bestemming. In die zin is het een zelflerend systeem. Als een netwerkpad niet beschikbaar of verzadigd is, wordt het geschrapt uit de tabellen en gaan de routers jou een andere route voorstellen.

Wie is CenturyLink?

CenturyLink beheert het grootste netwerk van de wereld. De organisatie, vroeger gekend als Level3, staat afgetekend aan de top op https://asrank.caida.org/.

asrank

Level27 is rechtstreeks verbonden met de top 3 van de wereld:

level27-netwerk-overview

 

Wat is er precies gebeurd?

Afgelopen zondag had CenturyLink een serieus probleem, van zodanig grote aard dat het noodzakelijk werd om hun netwerk over te slaan. Met andere woorden, andere netwerken moesten omleidingen plaatsen rond CenturyLink heen.

In principe gaat zo'n omleiding automatisch en zonder dat iemand het merkt. Maar van zo'n grote provider kan je niet zomaar al het verkeer omleiden. Je kan ook niet zomaar al het verkeer van de Kennedytunnel over de Liefkenshoektunnel sturen zonder dat daar files ontstaan :)

Bovendien was hier nog een extra probleem: CenturyLink respecteerde de omleidingen niet! Ze negeerden alle 'route withdrawals', wat betekent dat ze hardnekkig de routes aankondigen, ook al wilden de andere netwerken hen uitschakelen. Hierdoor bleef veel verkeer bij hen toekomen, en gezien de bestemming niet meer bij hun aangesloten was kwam dat verkeer nergens meer uit. De meeste providers hadden immers voor de zekerheid hun verbindingen met CenturyLink uitgezet.

Een dergelijke schending van het BGP-protocol gedurende zo'n lange periode van 6 uren is ongezien en een wereldspeler onwaardig...

Tijdens het hele incident waren de website én het support-systeem van CenturyLink onbereikbaar, dus communicatie was quasi onmogelijk.

De impact was groot over de hele wereld. Lokale verbindingen tussen Belgische internet providers als ons en operatoren als Telenet/Proximus werden na minder dan een uurtje hersteld door overal CenturyLink uit te schakelen. Internationaal bleef het echt wel urenlang instabiel tot CenturyLink zelf uiteindelijk zijn zaken in orde kreeg.

CenturyLink heeft het verknald en de hele wereld heeft het gemerkt.

Thomas Woidt

CTO

Vragen of opmerkingen?

Laat het ons zeker weten via onze chatbox!
We helpen je graag verder.

Deel deze blog via

Andere topics