IT-BUSINESS Aktion:

#ITfightsCorona

Hochverfügbarkeit im Netzwerk setzt Resilienz voraus

Warum Redundanz alleine nicht ausreicht

| Autor / Redakteur: Dirk Schuma / Andreas Donner

Smartes Out-of-Band-Management erkennt Schwachstellen in schadhaften Netzwerk-Komponenten, reduziert die Betriebskosten und minimiert Ausfallzeiten.
Smartes Out-of-Band-Management erkennt Schwachstellen in schadhaften Netzwerk-Komponenten, reduziert die Betriebskosten und minimiert Ausfallzeiten. (Bild: OpenGear)

Das Thema Hochverfügbarkeit im Netzwerk wird vor allem mit dem Begriff Redundanz verbunden. Die zweifache Ausführung von Netzwerk-Komponenten allein schützt allerdings nicht vor Ausfällen. Viel wichtiger ist der Punkt „Resilienz“: Das Netzwerk muss schnell wieder betriebsbereit sein. Und dabei können Out-of-Band-Management-Lösungen behilflich sein.

Ein Netzwerkausfall kann massive Auswirkungen für ein Unternehmen haben, auch wenn er nur ein paar Minuten dauert. Entsprechend gut sollte die kritische Infrastruktur für jede Eventualität gesichert sein.

Bei ausreichendem Budget lässt sich eine hohe Verfügbarkeit durch Redundanz erreichen. Alle Netzwerk-Komponenten werden dabei doppelt ausgelegt – das hilft bei einem Ausfall, indem ein anderer Pfad verwendet werden kann. Auch Wartungsarbeiten an Switches und Routern lassen sich so vornehmen, ohne den Netzbetrieb zu unterbrechen. Redundante Komponenten allein lösen allerdings nicht das Problem der Business Continuity. Im Gegenteil: Fällt das primäre Netzwerk aus oder durchtrennt jemand aus Versehen ein Kabel, bleibt das Netzwerk trotz doppelt vorhandener Switches oder Router offline.

Redundante Hardware schützt nur bedingt

Häufig liegt der Grund für Netzwerkausfälle auch nicht in der Hardware, sondern in einer fehlerhaften Software. Da Switches oder Router vom gleichen Typ in der Regel die gleichen Images verwenden, kann durch einen Softwarefehler selbst in redundant ausgelegten Netzen die gesamte Infrastruktur ausfallen. Die häufigste Quelle für Störungen sind zudem menschliche Bedienfehler. Konfiguriert ein Administrator einen oder zwei redundante Switches falsch, kann er dadurch ebenfalls das gesamte Netz lahmlegen.

Für eine hohe Verfügbarkeit ist es deshalb wichtig, wie schnell sich ein aufgetretenes Problem erkennen und beseitigen lässt. Resilienz ist hier das Schlagwort: Man bezeichnet ein System als resilient, wenn seine Funktionsfähigkeit bei Störungen nur wenig beeinträchtigt wird, es zu keinen größeren Schäden kommt und nach der Störung so schnell wie möglich wieder die volle Leistung zur Verfügung steht.

Dazu gehört auch der Aspekt, überhaupt zu wissen, dass es ein Problem gibt. Ein Unternehmen mit weltweit verteilten Niederlassungen, vielleicht sogar in verschiedenen Zeitzonen, wird trotz eigenem Network Operations Center seine Mühen haben, einen entsprechenden Überblick zu bekommen. Zudem werden die Verantwortlichen nicht proaktiv benachrichtigt, wenn eine Komponente offline geht. Doch selbst wenn sie es wissen, ist es nicht einfach herauszufinden, welches Gerät an welchem Ort eine Störung hat. Hierzu müsste jemand mit entsprechendem Wissen vor Ort sein, um das Problem zu beurteilen.

Was Out-of-Band mit Resilienz zu tun hat

Die bessere Lösung ist deshalb Out-of-Band-Management (OOB): Es ist unabhängig von der Funktion und Konnektivität des lokalen Netzwerks. In-Band-Tools wie Telnet (Teletype Network) sind gängige Methoden für Fernzugriff und Wartung, jedoch sind diese auf die Verfügbarkeit des primären Netzwerks angewiesen. Kommt es zu großen technischen Problemen wie Netzwerk- oder Konnektivitätsausfällen, bricht dieser Zugriff ab. In diesem Fall muss ein Techniker vor Ort reisen und das Problem analysieren. Nicht selten ist dieses Problem dann zwar in wenigen Minuten gelöst, indem etwa ein Neustart des Geräts durchgeführt wird. Allerdings kann der Techniker normalerweise erst nach seiner Ankunft feststellen, welche Schritte er einleiten muss, um den Schaden zu beheben. In beiden Fällen geht wertvolle Zeit verloren, in denen kritische Systeme nicht erreichbar sind.

In diesem Fall hilft Out-of-Band-Management. Netzwerkgeräte verfügen in der Regel über serielle Schnittstellen, die sich unabhängig vom primären Netzwerk ansprechen lassen und dem Administrator den vollen Überblick über den Status des Geräts geben. Reagiert ein Gerät nicht mehr, können Administratoren einen Hard Reboot über die Steuerung der Stromversorgung vornehmen, um per Fernzugriff Komponenten wie Server, WAN-, Netzwerk- und Stromversorgungsgeräte (PDUs) zu warten, zu verwalten und Fehler zu beheben.

Die Kommunikation mit der Zentrale erfolgt bei Out-of-Band-Lösungen über eine Failover-Verbindung, in der Regel Mobilfunk (4G/LTE). Ist der Mobilfunkempfang schlecht, steht die etwas langsamere Anbindung per Modem zur Verfügung. Damit ist ein durchgängiger administrativer Fernzugriff auf kritische Komponenten wie Switches, Router, PDUs und eine wachsende Zahl von Sicherheitsanwendungen wie Firewalls und Encryption-Tools gewährleistet. Mit Out-of-Band-Management reduzieren Unternehmen den unnötigen und teuren Vor-Ort-Support auf ein Minimum. Und falls dieser in schwereren Fällen dennoch notwendig ist, weiß der Techniker im Voraus, welche Ersatzteile er benötigt, um das Problem schnell zu lösen.

Die Diagnose ist inklusive

Out-of-Band-Lösungen bieten noch einen weiteren Vorteil: Der OOB-Konsolenserver stellt eine verschlüsselte direkte Verbindung zu kritischen Geräten wie Routern und Firewalls her. Der schnelle und sichere Zugriff auf die Protokolldateien der betroffenen Devices hilft, die Hauptursachen des Ausfalls zu identifizieren und Recovery-Maßnahmen schneller einzuleiten. Auch können Out-of-Band-Konsolenserver so konfiguriert werden, dass sie kritische Geräte ordnungsgemäß herunterfahren, wenn die Temperatur im Rack zu hoch ist oder die unterbrechungsfreie Stromversorgung einen Stromausfall erkennt und die Batterieleistung unter einen definierten Schwellenwert sinkt.

Dirk Schuma.
Dirk Schuma. (Bild: OpenGear)

Diese geschickte Kombination aus Diagnose und schneller Wiederherstellung ist entscheidend, um ein resilientes Netzwerk herzustellen. Bezahlt macht sich eine Out-of-Band-Lösung meistens schon durch wenige Stunden vermiedene Downtime und den ersten eingesparten Supporteinsatz vor Ort. Aufgrund der zunehmend komplexer werdenden IT-Infrastrukturen durch Cloud-Computing und Internet of Things ist für Unternehmen die schnelle Identifizierung und Behebung von Verbindungsproblemen zu verteilten Infrastrukturen eine zentrale Aufgabe.

Über den Autor

Dirk Schuma ist Sales Manager Europe bei OpenGear.

Kommentare werden geladen....

Sie wollen diesen Beitrag kommentieren? Schreiben Sie uns hier

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Kontaktieren Sie uns über: support.vogel.de/ (ID: 46350551 / Software)