Der Begriff Tech-Stack macht deutlich: IT-Teams befassen sich heute mit einem ganzen Stapel an Software. Aus dieser Komplexität folgen viele Herausforderungen und Fehlfunktionen, auf die automatisierte Benachrichtigungen hinweisen können. Doch auch deren Menge nimmt immer weiter zu. Gehen die Teams in der schieren Menge der Meldungen unter und verlieren den Überblick, spricht man von „Alert Fatigue“.
Durch die wachsende Komplexität von Tech-Stacks und deren laufende Veränderung wird es für IT-Teams immer schwerer, den Überblick zu behalten, denn zu viele Alerts trüben den Fokus. Daher ist es wichtig, sowohl die Software selbst zu überwachen und anzupassen als auch deren Monitoring.
(Bild: lucadp - stock.adobe.com)
Warnmeldungen müssen regelmäßig mit dem Tech-Stack aktualisiert werden. Passiert das nicht, kann das zu irrelevanten oder sogar falsch-positiven Benachrichtigungen führen. Sind IT-Teams ob der schieren Menge überfordert und können relevante Meldungen nicht mehr herausfiltern, spricht man von Alert Fatigue. Das ist einerseits frustrierend für die Mitarbeiter und andererseits kann es dem Unternehmen schaden: So entstehen ineffiziente Prozesse und wichtige Sicherheitslücken bleiben unerkannt – was Cyberangriffe erleichtert. Doch Unternehmen können etwas dagegen unternehmen und im Tech-Stack für System Health und bei Angestellten für Mental Health sorgen.
Um Alert Fatigue vorzubeugen ist es wichtig, die Monitoring-Strategie kontinuierlich zu überprüfen und zu aktualisieren. Unnötige Benachrichtigungen sollten in diesem Zuge entfernt oder an die neuen Gegebenheiten angepasst werden. In größeren Unternehmen mit Tausenden von Warnungen erfolgt die Umsetzung am besten auf Teamebene. So können die Unternehmen sicherstellen, dass die Benachrichtigungen zu den spezifischen Aufgaben der einzelnen Teams passen.
Wo drückt der Schuh?
Zunächst müssen dafür die störenden Alerts identifiziert werden. Das sind oft genau diejenigen, die am häufigsten ausgelöst werden. Im Großen und Ganzen kann man hier zwischen zwei Arten von Alerts unterscheiden: vorhersehbare und instabile .
Vorhersehbare Alerts: Einige Meldungen bilden konstante und somit vorhersehbare Muster. Das sind zum Beispiel Benachrichtigungen zum Start und Ende eines automatisierten Back-ups. Auch Warnungen für Probleme, die zwar unerwünscht sind, aber regelmäßig auftreten und akut keine Gefahr darstellen, gehören dazu. Ein Alarm sollte allerdings nur ausgelöst werden, wenn ein unerwartetes Ereignis eintritt. Für die Back-up-Meldungen bedeutet das: Sollte dabei etwas nicht funktionieren, geht der entsprechende Alert unter Umständen zwischen den regulären Statusmeldungen unter.
Instabile Alerts:Solche Alerts informieren in unnötig hoher Frequenz darüber, dass etwas zwischen verschiedenen Zuständen hin- und herwechselt. Meist muss auf diese Alerts erst gar nicht reagiert werden, weil sie sich von selbst wieder lösen oder nur kurzzeitige Lastspitzen darstellen. Auch hier bietet sich das Back-up-Beispiel an: Eine Warnung wird z. B. ausgelöst, wenn die Festplattennutzung länger als fünf Minuten 90 Prozent überschreitet. Sobald die Sicherung abgeschlossen ist und die Festplattenauslastung unter 90 Prozent sinkt, wird der Status der Warnung wieder auf OK gesetzt. Solche Warnmeldungen können die Teams schnell überfordern, denn auch diese Alerts benachrichtigen nicht über irreguläre Vorgänge und erzeugen so Rauschen in den Daten.
Weniger ist mehr
Sobald die störenden Benachrichtigungen identifiziert sind, können sie angepasst werden, um die Warnfrequenz zu verringern und ihre Wirksamkeit zu erhöhen. Dazu kann es helfen, das Auswertungsfenster auszuweiten. Das Auswertungsfenster definiert die Häufigkeit, mit der das Überwachungstool die relevanten Daten auswertet und mit den Warnbedingungen vergleicht. Ein weit verbreiteter Irrglaube ist, dass ein größeres Auswertungsfenster langsamere Reaktionen oder verpasste Alarme verursachen könnte, aber das ist nicht der Fall. Die Software wertet die zugrundeliegenden Daten kontinuierlich aus. Eine Vergrößerung des Auswertungsfensters gewährleistet, dass das System vor einer Entscheidung mehr Datenpunkte berücksichtigt. So wird ausschließlich gewarnt, wenn eine Grenzüberschreitung dauerhaft auftritt.
Ein ähnliches Vorgehen bietet sich bei instabilen Alerts an. Für solche lassen sich Schwellenwerte für die Wiederherstellung definieren. Das IT-Team erhält dadurch erst eine Benachrichtigung, wenn ein Schwellenwert über eine längere Zeit überschritten wird. Ist die Bedingung für einen Alert beispielsweise, dass die CPU-Auslastung eines Servers 80 Prozent überschreitet, wirkt in diesem Falle eine automatische Skalierung bei einmaligen Spitzen dagegen. Binnen kurzer Zeit ist die Auslastung wieder unter dem Schwellenwert, sodass der Status automatisch umspringt und ein manuelles Eingreifen sich erübrigt.
Alerts konsolidieren
IT-Teams können Alerts auch in bestimmten Gruppen organisieren, z. B. nach Service, Cluster, Host, Gerät und weiteren Kriterien. Um Alert Fatigue vorzubeugen, sollten sie darauf achten, eine Entität nicht in mehrere Gruppen gleichzeitig zu stecken. Sonst können durch die große Anzahl von beobachteten Entitäten Alarme schnell unübersichtlich werden. Nehmen wir einmal an, die Latenz einer Gruppe kritischer Dienste, die jeweils auf mehreren Hosts laufen, soll überwacht werden. Man definiert daher einen Alert mit zwei Dimensionen: Host und Service. Wann immer nun ein einzelner Host nicht verfügbar ist, folgen Benachrichtigungen über den Zustand sowohl des Hosts als auch des Services. Letztere sind dann aber irrelevant. Bündelt man den Alert allerdings für die Service-Dimension, senkt das die Anzahl der Benachrichtigungen. Gleichzeitig ist nach wie vor möglich, Informationen auf Service- und Host-Level zu erhalten – das Rauschen aber auf ein Minimum zu reduzieren.
Außerdem hilft es, die Empfänger der Alerts einzuschränken, sodass nur diejenigen die Benachrichtigungen erhalten, die sich auch darum kümmern können. Und umgekehrt: Die Meldung geht nur an die Teams, die sie auch betreffen. Darüber hinaus ist es mit einigen Plattformen möglich, Alerts direkt nach Priorität zu ordnen. Bei Wartungsarbeiten oder Upgrades ist es sinnvoll, Benachrichtigungen komplett auszusetzen. Während einer bewussten Downtime warnt das Monitoring dann nicht fortlaufend vor Unregelmäßigkeiten, was dem IT-Team eine Nachrichtenflut erspart.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
Den Durchblick behalten
Gerade im Zuge der Digitalisierung mit wachsender Komplexität von Tech-Stacks und ihrer laufenden Veränderung müssen IT-Teams und Unternehmen den Überblick behalten. Zu viele Alerts trüben aber den Fokus. Daher ist es wichtig, sowohl die Software selbst zu überwachen und anzupassen als auch deren Monitoring. Das betrifft zum einen die entsprechende Sensibilisierung der Teams, zum anderen bieten auch entsprechende Plattformen die Möglichkeit, Alerts zu organisieren. Das erleichtert nicht nur die Arbeit der IT-Teams, sondern ermöglicht effizientere und damit wirtschaftlichere Prozesse im Unternehmen.
Über den Autor: Stefan Marx ist Director Platform Strategy beim Cloud-Monitoring-Anbieter Datadog. Marx ist seit über 20 Jahren in der IT-Entwicklung und -Beratung tätig. In den vergangenen Jahren arbeitete er mit verschiedenen Architekturen und Techniken wie Java Enterprise Systemen und spezialisierten Webanwendungen. Seine Tätigkeitsschwerpunkte liegen in der Planung, dem Aufbau und dem Betrieb der Anwendungen mit Blick auf die Anforderungen und Problemstellungen hinter den konkreten IT-Projekten.