Publicatie in Computable, 03-07-2008
BBNed: nieuwe klanten vragen om tweede lijn na KPN-storing
Nederland werd afgelopen lente getroffen door de grootste internetstoring ooit, veroorzaakt door een softwarefout in switches van KPN. Wat kunnen providers doen om dergelijke problemen in de toekomst te voorkomen? En wat kun je zelf doen om jouw verbinding tegen uitval te beschermen?
Naar schatting miljoenen internetgebruikers kampten in mei dit jaar met problemen, variërend van een langzame verbinding tot een complete internetuitval (black out). De storing trof niet alleen particulieren, maar vooral ook zakelijke gebruikers (zoals abonnees van Business ADSL van KPN en XS4All). Dat roept vragen op over de hard- en softwareconfiguratie van internetproviders. Bijvoorbeeld welke oorzaken er zijn voor storingen, in welke mate het netwerk redundant is uitgevoerd en hoe een dergelijke storing in het vervolg valt te voorkomen.
Internettoegang veiligstellen
Internetproviders gebruiken in de regel meerdere ‘gateways’ voor internettoegang, door contracten te sluiten met diverse internet transit providers (of carriers) en peering providers. “Een jaar of vijf, zes geleden vertrouwden we nog op één enkele gateway” vertelt Theo Drenth, Manager Product Management bij BBNed. “Dat voldoet niet meer gezien de steeds grotere afhankelijkheid van het internet.”
“Wij werken momenteel met drie carriers, via drie verschillende geografisch gescheiden knooppunten. Als één van de knooppunten uit zou vallen, ondanks redundante netwerkverbindingen, kost dat dus maximaal eenderde van de capaciteit. Bovendien hebben we regelingen om realtime tijdelijk extra capaciteit te gebruiken bij onze andere carriers.” KPN gaat uit van minimaal twee verschillende carriers en hanteert daarnaast meerdere uitvalswegen richting het internet.
Oorzaken van een storing
Er kunnen verschillende oorzaken zijn voor een internetstoring. KPN laat bij monde van woordvoerder Stefan Simons weten dat routeringsproblemen tussen verschillende internetproviders één van de meest voorkomende storingen is. “En op het aansluitnetwerk is niet alles tot aan de klant redundant uitgevoerd” zegt Simons. “Uitval van apparatuur of een verbroken verbinding zijn daar de meest voorkomende problemen. Dat laatste doet zich met name voor in combinatie met bijvoorbeeld bouw- of graafwerkzaamheden.”
Drenth van BBNed noemt nog een heel andere oorzaak: “Storingen bij zakelijke klanten ontstaan in de meeste gevallen door een lokaal probleem - bij de klant zelf dus. Veel bedrijven in het mkb gebruiken één breedbandlijn voor verschillende bedrijsfkritieke oplossingen, zoals internet, telefonie en hosting. Bij een storing ligt niet alleen de internettoegang er uit, maar ook de bedrijfswebsite en de communicatie. Vaak is het netwerk onvoldoende beveiligd: geen afgesloten netwerkruimte, geen noodstroomvoorziening en soms ook matig vooronderzoek voor hard- of softwarematige upgrades in relatie tot het netwerk.”
Redundant netwerk
Natuurlijk proberen providers storingen zoveel mogelijk te voorkomen door hun netwerk geheel redundant uit te voeren. Voor eventuele stroomuitval zijn de voorzieningen op hetzelfde niveau als van grote datacenters, dus met ups’en (uninterruptable power supplies) en dieselgeneratoren. Top level domain servers zijn over de wereld verspreid. Kritieke verbindingen worden over gescheiden paden redundant aangelegd.
Net zoals BBNed heeft KPN ook draaiboeken om uit te wijken naar andere gateways bij uitval van een PoP-locatie (Point of Presence). “Dit zal voor veel klanten een oplossing bieden, maar nooit voor allemaal”, aldus Simons van KPN. “Bij uitval van een knooppunt als de AMS-IX zal in Nederland verminderde connectiviteit zijn, maar dat zal het internetverkeer niet volledig lam leggen.”
Onderhoud
Een always-on dienst als internet is gebaat bij een secuur patchbeleid. KPN hanteert daarom standaard onderhoudstijden. “Voor zakelijk internet is dit elke dinsdagnacht tussen 03:00 en 07:00”, verklaart Simons. “Patches worden eerst getest in een pre-productieomgeving. Na een gemiddelde proeftijd van twee weken worden ze geaccepteerd.”
“Vervolgens wordt er één element in de productieomgeving gepatched, waarna andere elementen pas volgen na twee weken monitoring. In het geval van calamiteiten kan van deze procedure worden afgeweken.” De bewuste KPN-storing van mei werd overigens veroorzaakt door een niet eerder ontdekte softwarebug in een switch (zie kader).
Drenth van BBNed merkt op dat de groei van het internetgebruik het patchbeleid bemoeilijkt: “Enkele jaren terug was er nauwelijks internetactiviteit tussen drie en vijf uur ‘s nachts, waardoor onderhoud op dat tijdstip geen probleem was. Het internetverkeer is echter flink toegenomen, waardoor we zelfs op dat tijdstip gemiddeld op een belasting van 10 procent zitten. Het komt daardoor steeds vaker voor dat wijzigingen realtime worden doorgevoerd, mits het netwerk redundant is. Maar uiteraard wordt onderhoud buiten de piekuren uitgevoerd.”
Backupvoorzieningen
Volgens Theo Drenth heeft BBNed sinds de grote KPN-storing van mei een hoop nieuwe verzoeken gekregen voor het aansluiten van een tweede lijn. “Middelgrote en kleine bedrijven kunnen hun netwerk redundant maken door twee lijnen van verschillende internetproviders te gebruiken. Als er een storing is bij één van de twee providers, dan kunnen de bedrijfsactiviteiten tenminste worden voorgezet op basis van de tweede ‘backup’ lijn.”
“Het is daarnaast mogelijk om routers het verkeer automatisch om te laten schakelen bij eventuele verbindingsproblemen, zodat het netwerk nauwelijks hinder ondervindt. Bovendien kan via ‘load balancing’ de capaciteit van beide lijnen optimaal worden benut.” Een noodoplossing om een internetstoring op te vangen is een dubbele ISDN-lijn. De verbinding is dan weliswaar traag, maar toch bruikbaar om basisactiviteiten zoals e-mail veilig te stellen.
Draadloze alternatieven als UMTS en WiMax zijn nog niet erg populair als backup, omdat dit ingrijpende technische voorzieningen vereist en alleen effectief is als uitvalmogelijkheid wanneer er een storing is in het aansluitnetwerk. KPN heeft wel eens straalverbindingen aangelegd, maar dan ging het om uitzonderlijke situaties waarbij meestal ook slechts één bedrijf was getroffen. Zowel KPN als BBNed bieden klanten ook mogelijkheden voor een dubbel aangesloten verbinding die over verschillende aansluitnetwerken loopt.
Aansprakelijkheid
Al deze mogelijkheden voor het voorkomen en opvangen van storingen bieden echter geen 100 procent garantie én kosten nogal wat. Internetproviders bieden dan ook verschillende ‘service level agreements’ (SLA’s) voor zakelijke internetaansluitingen. Deze contracten kunnen per klant afwijken op het gebied van bandbreedte, de overbookingsfactor en garanties voor beschikbaarheid. Eventuele schadevergoedingen worden afgehandeld op basis van algemene of specifieke voorwaarden, zoals opgesteld in het contract.
In alle gevallen stellen internetproviders financieel niet verantwoordelijk te zijn voor eventuele schade, aangezien de omvang van dergelijke claims niet te overzien is. Bij een storing van meer dan 24 uur is de maximale compensatie in de meeste gevallen het abonnementsbedrag van één maand. In veel gevallen weegt dat niet op tegen de daadwerkelijke kosten, zoals verlies van productiviteit of indirecte gevolgschade. Het is dus niet alleen aan de provider, maar ook aan bedrijven zelf om zich te beschermen tegen internetstoringen.