31. August 2009 - Verfügbarkeitskontrolle

So testen Sie Notfallpläne

Für die Verfügbarkeitskontrolle ist nicht nur die Entwicklung, sondern auch der Test der Notfallpläne entscheidend. Nur wenn sich Notfallpläne in einem realitätsnahen Test bewiesen haben, können sie auch wirklich zur Steigerung der Datensicherheit beitragen. Sorgen Sie deshalb dafür, dass es neben passenden Notfallplänen auch passende Testpläne gibt und begleiten Sie die regelmäßig erforderlichen Tests.

so-testen-sie-einen-notfallplan.jpeg
So sollte es nach dem Test von Notfallplänen möglichst nicht aussehen ... (Bild: 110stefan/PIXELIO)

Systemausfälle verärgern nicht nur Kunden und führen zu Umsatzverlusten. Ohne Notfallvorsorge können sich Systemausfälle zu einem umfangreichen Datenverlust und zu einer Katastrophe für ein Unternehmen auswachsen.

Notfallpläne: Theorie und Praxis klaffen oft auseinander

Doch garantierte Verfügbarkeiten in Service Level Agreements (SLA) und tatsächliche Wiederherstellungs-Zeiten klaffen mitunter weit auseinander.

Trotzdem lassen viele Unternehmen ihre Notfallpläne und Notfallhandbücher in den Schubläden und testen sie nicht auf ihre Tauglichkeit. Sie verlassen sich darauf, dass die geplante Notfallvorsorge so greift, wie gedacht.

Teststrategie für Notfallpläne fehlt oft

Dabei ist nicht unbedingt Nachlässigkeit der Grund für fehlende Tests. Die Unternehmen wissen zwar um die Notwendigkeit einer Notfall-Simulation. Aber sie

  • fürchten den Aufwand und
  • die Auswirkungen auf produktive Systeme,
  • haben keine geeignete Strategie für einen solchen Test oder aber
  • keine geeigneten Tools, die den Test automatisch unterstützen können.

Keine Notfallpläne ohne Testplan

Bei der Verfügbarkeitskontrolle sollten Sie deshalb nicht nur einen Notfallplan erwarten, sondern auch das zugehörige Testkonzept.

In diesem Testplan sollten je nach erforderlicher Verfügbarkeit und maximal erlaubter Wiederanlaufzeit nicht nur Checklisten-Tests vorgesehen sein, die jede Abteilung für sich am Schreibtisch abarbeitet.

Auch abteilungsübergreifende Testszenarien (also Ausfall von Systemen in mehr als einer Abteilung) und Gegenchecks unter den Abteilungen sind hilfreich.

Dabei sollten insbesondere Ressourcen bedacht werden, die zwar in einer Abteilung betrieben werden, aber für andere Bereiche ebenfalls von Bedeutung sind. Auch Simulationstests können Schwachstellen in den Notfallplänen erkennen lassen, wenn also angenommen wird, es käme zum Ausfall eines relevanten Systems.

Die folgende Checkliste soll bei den Tests von Notfallplänen eine Unterstützung bieten und hilft Ihnen dadurch bei der Verfügbarkeitskontrolle.

Prüfansätze Ja Nein
Wurde der Ausfall wie geplant entdeckt (Zeitspanne, Meldungsweg)?
Kann die USV (unabhängige Stromversorgung) den vorgesehenen Ausfallzeitraum überbrücken?
Haben die Datensicherungsmaßnahmen gegriffen? Konnte also ein Datenverlust dank Backup vermieden werden?
Haben sich die Betriebssysteme, Datenbanken, Applikationen und Dienste wie erwartet verhalten (Herunterfahren oder doch Absturz)?
War die Wiederanlaufzeit innerhalb der geplanten Spanne?
Wurden alle Testfälle für den Notfallplan abgearbeitet?
Konnten Störungen durch die Tests für den Echtbetrieb vermieden werden (Tipp: Tests außerhalb von Geschäftszeiten)?
Wurden die Schwachstellen dokumentiert und zur Behebung vorgesehen (Zuständigkeiten, Termine)?
Wurden Notfallpläne und/oder Testpläne entsprechend der gefundenen Schwachstellen abgeändert?
Wurden weitere Tests bereits fest eingeplant?

Ausfallsicherheit und Backup wollen geprüft sein

Redundante Systeme, die zur Erreichung einer bestimmten Ausfallsicherheit betrieben werden, bieten zudem die Möglichkeit, Systeme und Parallel-Systeme gemeinsam und abwechselnd zu testen.

Der maximale Testumfang hingegen sieht eine tatsächliche Abschaltung eines Systems vor, mit der Erwartung, dass das Ersatzsystem in geplanter Zeit den Betrieb aufnimmt.

Dieser Test ist jedoch nur dann sinnvoll, wenn alle anderen Teststufen bereits durchgeführt und erfolgreich absolviert wurden. Wenn eine testweise Abschaltung nicht in Frage kommt, sollte der Test so ablaufen, dass die angeblich ausgefallenen Systeme überwacht werden, ob sie nicht doch ungewollt innerhalb des Tests genutzt werden.

Testzeitpunkte der Notfallpläne festlegen

Zur Testplanung gehört neben den regelmäßigen Testzeitpunkten (zum Beispiel quartalsweise) auch die Festlegung, unter besonderen Umständen zusätzlich einen Test des Notfallplans durchzuführen, zum Beispiel wenn

  • neue geschäftskritische Hardware eingebunden,
  • neue geschäftskritische Software installiert,
  • neue relevante Dienstleister beauftragt wurden oder
  • die Notfallplänr bereits geändert werden mussten.

Um sinnvolle Test zu gewährleisten, müssen die Mitarbeiter rechtzeitig geschult werden, so dass sie die von ihnen erwarteten Maßnahmen auch angehen können.

Dokumentation und Nachbesserung der Notfallpläne sind entscheidend

Der ganze Testaufwand von Notfallplänen lohnt allerdings nicht, wenn keine saubere Testdokumentation stattfindet und aus den entdeckten Schwachstellen keine Konsequenzen gezogen werden.

Dabei können die Schwachstellen nicht nur in den Notfallplänen stecken, sondern auch im Testkonzept selbst. Wie zuvor erwähnt sollte auf die Behebung der Schwachstellen ein neuer Test folgen, nach dem Motto „Nach dem Test ist vor dem Test“.

Oliver Schonschek
Oliver Schonschek ist Diplom-Physiker und Fachjournalist.

 

Sie glauben, Sie hätten noch so viel Zeit? Falsch! Es gibt mehr zu tun, als Sie vielleicht denken! ▶ Zeit zu handeln