Vier Hauptbereiche, in denen Backups schief gehen

Vier Hauptbereiche, in denen Backups schief gehen

Trotz der weit verbreiteten Formen der Datensicherung – die von lokalen RAID über Snapshots und Replikation bis hin zum Vorhalten von Kopien in der Cloud – die Tatsachen sind, dass backup ist nach wie vor grundlegend für die IT.

Das liegt daran, dass egal, welche anderen Methoden Sie verwenden – Snapshots, Replikationund so weiter – jede Beschädigung von Daten wird mitkopiert, daher ist eine gute Bibliothek mit Backups erforderlich, die so weit wie möglich zurückreichen, um ein Rollback durchzuführen.

Aber Backups schlagen fehl – und laut einer aktuellen Umfrageliegt die Ausfallrate bei erschütternd hohen 37 %.

Backups schlagen aus einer Vielzahl von Gründen fehl, und in diesem Artikel geben wir einen Überblick über die wichtigsten Ursachen.
Einige sind unerwartet und nicht besonders vermeidbar, wie z. B. Festplattenausfälle, die aber abgemildert werden können.

Andere sind zu erwarten und können entschärft werden, wie z. B. Probleme, die nach Patches oder Änderungen an anderen Konfigurationen auftreten.

Dann gibt es noch das menschliche Element, wie z. B. die Sicherstellung, dass Sie Backups richtig einrichten und wissen, wie Ihre Backup-Software funktioniert.

Medienausfälle

Hardware ist eine unangenehme Tatsache des Lebens in der IT. Unangenehm, weil sie ausfallen kann. Bei Festplatten kann der Ausfall unerwartet kommen, obwohl bei Spinning-Disks bekannt ist, dass etwa eine von 100 jährlich den Geist aufgeben wird.

Backups können also ausfallen, weil Laufwerke ausfallen, aber das kann und sollte durch Redundanz wie über RAID.
Auch Solid-State-Laufwerke (SSDs) können ausfallen, allerdings mit einer geringeren Rate als Festplattenlaufwerke (HDDs), obwohl SSDs eher eine begrenzte Lebensdauer haben.
Auch hier liegt der Schlüssel darin, Hardware-Redundanz und Auffrischungen einzubauen.

Band hat seine eigenen Ausfallmechanismen, die sich auf die Auswirkungen von Zeit und Gebrauch auf die magnetischen Medien selbst und ihre Beziehung zu den Leseköpfen konzentrieren.

Die Herstelleranweisungen zur Bandaufbewahrung und -wartung sollten befolgt werden, und die Besonderheiten der Medien sollten beachtet werden – Leseköpfe und Medien können sich zum Beispiel auf eine Art und Weise abnutzen, die sich möglicherweise erst zeigt, wenn Sie Daten auf anderen Geräten wiederherstellen wollen.

Wenn es darum geht, Hardware-Ausfälle zu vermeiden, die sich auf Backups auswirken, ist es wichtig, Redundanz einzubauen, auch durch Dinge wie 3-2-1-Sicherung.

Software-Probleme

Probleme im Zusammenhang mit Software umfassen eine große Bandbreite an potenziellen Problemen, die das Backup beeinträchtigen können.
Eine der häufigsten Ursachen für das Scheitern von Backups ist, dass Änderungen, die durch Upgrades oder Patches verursacht werden, bei der nächsten Ausführung eines Backups Probleme verursachen.

Das kann daran liegen, dass Upgrades oder Patches – die oft eine sehr große Anzahl von Änderungen an der Software umfassen – Inkompatibilitäten mit der Backup-Konfiguration erzeugen können. Dazu können Änderungen an Anwendungen gehören, die dazu führen, dass irgendwo im Stack etwas nicht mehr unterstützt wird, sowie Sicherheitsupdates, die Einstellungen ändern oder zurücksetzen, so dass Backups keine Verbindung mehr herstellen können.

Die wichtigste Methode zur Schadensbegrenzung besteht darin, sich bewusst zu machen, dass Updates stattfinden werden, und auf die Art von Störungen bei Backups – und anderswo – vorbereitet zu sein, die auftreten können. Die Predictive-Analytics-Plattformen einiger Anbieter können helfen, indem sie potenzielle Probleme mit bestimmten Konfigurationen von Updates und installierter Software vorhersehen können.

Manchmal kann die Backup-Software selbst versagen. Zu den Problemen können mit der Anwendung verbundene Dienste gehören, die nicht ausgeführt werden, Agenten, die nicht korrekt installiert werden, Verbindungsprobleme, Lese-/Schreibfehler und sogar Dinge wie Sommerzeitänderungen, die sich auf die Einstellungen des Backup-Fensters auswirken. Hier müssen Sie die Support-Ressourcen des Anbieters auf Lösungen überprüfen.

Virtualisierte Umgebungen können ihre eigenen besonderen Probleme mit sich bringen. Die Erstellung, Migration und Außerbetriebnahme von virtuellen Maschinen (VMs) und deren Daten bringt notwendigerweise viele Änderungen mit sich und die Backup-Software muss den Überblick über eine potenziell sehr komplexe Landschaft behalten.

Fehler rund um das Backup können durch korrupte Kataloge, unzureichende Berechtigungen und Dinge wie Volume Shadow Copy Service (VSS) Ausfälle und Beschädigungen von virtuellen Festplatten (VHD).

Das Auftreten von weit verbreiteten Verwendung von Containern wird aufgrund ihrer schnelllebigen Lebenszyklen wahrscheinlich weitere Komplikationen mit sich bringen.

Menschliches Versagen

Es ist eine grundlegende Tatsache, dass Menschen für die Überwachung des Einsatzes und des Betriebs von Backup-Prozessen verantwortlich sind, egal wie automatisiert, daher gibt es immer Raum für menschliches Versagen im Prozess.
Der Schlüssel ist, die Wahrscheinlichkeit zu verringern, dass Ihre Backups davon betroffen sind.

Die Konfiguration von Backups, die Kenntnis des/der verwendeten Backup-Produkts/e und der darin enthaltenen Tools, die bei der Automatisierung von Aufgaben helfen können, ist der Ausgangspunkt. Die richtige Konfiguration und das Wissen, wie man die eingebauten Tools nutzt, um Datensätze, Anwendungen, Dienste und andere Abhängigkeiten zu erkennen, ist der Schlüssel zu erfolgreichen Backups – und, was vielleicht noch wichtiger ist, zu erfolgreichen Wiederherstellungen.

Schließlich ist ein Backup nichts ohne die Möglichkeit, Daten wiederherzustellen, egal ob es sich um eine einzelne Datei oder ein ganzes System handelt. Im letzteren Fall ist es wahrscheinlicher, dass Sie sich der kritischen Abhängigkeiten bewusst sind und sichergestellt haben, dass diese geschützt und wiederherstellbar sind.

Hier verfügt der Anbieter möglicherweise über einige nützliche Erkennungswerkzeuge, aber seien Sie vorsichtig, dass Sie wissen, was diese in Bezug auf Abhängigkeiten möglicherweise nicht entdeckt haben. Eine Kernanwendung kann Abhängigkeiten wie z. B. die Zugriffskontrolle haben, die für die Wiederaufnahme des Betriebs unerlässlich sind.

Eine wichtige Methode, um in Bezug auf das menschliche Element vorbereitet zu sein, ist die Durchführung regelmäßiger Tests und die Erstellung von Richtlinien und Prozeduren, um Dinge abzudecken, die durch die Lücken fallen könnten, mit denen Maschinen nicht umgehen können.

Ausfälle der Infrastruktur

Backups müssen alle möglichen Infrastrukturen durchqueren, so dass ein Ausfall an irgendeiner Stelle Backup und Wiederherstellung beeinträchtigen kann, wobei letztere potenziell noch anfälliger ist.

Die Infrastruktur kann Bandlaufwerke und Bibliotheken, Disk-Arrays, Backup-Server, Netzwerke und zunehmend auch die Verbindung zur Cloud umfassen.

Der Schlüssel zur Entschärfung von Infrastrukturproblemen ist, wieder einmal, Redundanz. Stellen Sie also sicher, dass für die Teile der Infrastruktur, die Sie verwalten, Redundanz eingebaut ist, sei es auf der Ebene der Medien, der Server oder der Konnektivität.

Für die Teile, über die Sie keine direkte Kontrolle haben – wie Wide-Area-Network (WAN)-Verbindungen, Cloud-Ressourcen und so weiter – sollten Sie klare Service-Level-Vereinbarungen (SLAs) müssen vorhanden sein.
Und stellen Sie sicher, dass die Infrastruktur vorhanden ist, um im Katastrophenfall die Wiederaufnahme der Arbeit zu ermöglichen.

Seit der Pandemie hat sich der Bedarf an Fernarbeit zu unterstützen hat die Infrastrukturprobleme in den Vordergrund gerückt. Es brachte die Notwendigkeit mit sich, die Fähigkeit bestehender Softwareprodukte zu prüfen, die Sicherung von Edge-Geräten zu handhaben, oder sogar die Notwendigkeit, ein spezialisiertes Produkt für diese Aufgabe zu beschaffen.

Share

Leave a Reply

Your email address will not be published. Required fields are marked *