Incremental Forever Backup

3 Wege zur inkrementellen Datensicherung

16.01.2024
Von 
W. Curtis Preston ist Experte in Sachen Backup, Storage und Recovery und schreibt unter anderem für unsere US-Schwesterpublikation Network World.
Incremental-Forever-Backup-Methoden im Fokus: Finden Sie heraus, mit welchem Datensicherungskonzept Sie am besten fahren.
Welche Form der inkrementellen Datensicherung ist für Ihren Fall die richtige?
Welche Form der inkrementellen Datensicherung ist für Ihren Fall die richtige?
Foto: VectorMine - shutterstock.com

Eine traditionelle Datensicherung beginnt mit einem anfänglichen Voll-Backup, gefolgt von einer Reihe inkrementeller oder kumulativer Sicherungen (auch als differenzielle Datensicherung bezeichnet). Nach einer gewissen Zeit führen Sie eine weitere vollständige Sicherung und weitere inkrementelle Sicherungen durch.

Mit dem Aufkommen von Disk-basierten Backup-Systemen hat sich jedoch das Konzept des Incremental Forever Backup durchgesetzt. Allerdings gibt es drei Wege, dieses umzusetzen. Idealerweise führen Sie mit jedem dieser Ansätze Backup- und Recovery-Testläufe durch, um den zu ermitteln, der für Ihren Fall die beste Performance liefert.

1. Inkrementelles Backup auf File-Level

Der erste Incremental-Forever-Backup-Typ funktioniert auf Dateiebene. Der File-Level-Ansatz existiert bereits seit den 1990er Jahren und verdankt seinem Namen dem Umstand, dass die Entscheidung darüber, ob etwas ins Backup einfließt, auf Dateiebene getroffen wird. Wird die betreffende Datei verändert, wird auch ihr Änderungsdatum (beziehungsweise das Archiv-Bit in Windows) angepasst und das gesamte File gesichert - selbst wenn die Änderung nur ein Byte betrifft.

Um als inkrementelle Backup-Lösung mit "Forever"-Zusatz durchzugehen, muss das betreffende Produkt lediglich eine vollständige Datensicherung, gefolgt von inkrementellen Backups durchführen. Eine erneute, vollständige Datensicherung entfällt. Einige kommerzielle Lösungen in diesem Bereich werden zwar als Forever-Backup vermarktet, setzen dabei jedoch weiterhin auf mehrere Voll-Backups, nur dass diese synthetischer Natur sind. Das sind keine echten Incremental-Forever-Backup-Lösungen.

Der Grund für diese Unterscheidung: Es bietet Vorteile, nur ein vollständiges Backup durchzuführen, die darüber hinausgehen, Verarbeitungszeiten und Netzwerkverkehr auf dem Backup-Client zu reduzieren. Zum Beispiel reduziert das auch die Menge der Daten, die im Datensicherungssystem abgelegt werden müssen und damit auch die Kopiervorgänge. Ein Incremental-Forever-Backup-Ansatz ist zudem ein guter Startpunkt in Richtung Deduplizierung. Schließlich müssen selbst synthetische Voll-Backups dedupliziert werden - was eine Verschwendung von Rechenleistung darstellt. Der größte Vorteil von Lösungen dieser Art besteht allerdings darin, dass keine CPU-Verarbeitung, kein Netzwerk und kein Speicherplatz für zusätzliche vollständige Backups verschwendet wird. Das führt in der Konsequenz außerdem dazu, dass Datensicherungen auch weniger Zeit in Anspruch nehmen.

Ein weiterer Vorteil: Das System "weiß" von vorneherein, welche Versionen welcher Dateien bei einem Restore wiederhergestellt werden müssen - und kann dann auch nur diese Dateien wiederherstellen (im Gegensatz zu einem vollständigen Backup). Das sorgt für weitere Zeit- und Nervenersparnisse. Allerdings ist diese Methode zur Datensicherung nicht mit Bandmedien kompatibel.

Dennoch ist der inkrementelle Datensicherungsansatz auf File-Ebene nicht mehr gebräuchlich.

2. Incremental Backup auf Block-Level

Ein weiterer Ansatz für Incremental-Forever-Backups ist die Datensicherung auf Blockebene. Block-Level- und File-Level-Ansatz ähneln sich insofern, als sie ein einziges vollständiges Backup und eine Reihe von inkrementellen Sicherungen durchführt.

Die Entscheidung darüber, was wie gesichert wird, wird dabei entsprechend auf Bit- oder Blockebene gefällt. Damit dieser Ansatz funktioniert, muss die zugrundeliegende Applikation eine Bitmap der Daten und Teile, die sich verändern, vorhalten. Das bezeichnet man als Changed Block Tracking (CBT). In Virtualisierungsumgebungen wird das in der Regel durch den Hypervisor bereitgestellt, etwa VMware oder Hyper-V. Wenn es Zeit für das nächste Backup ist, fragt die Datensicherungssoftware nach der Bitmap der Blöcke, die sich seit dem letzten inkrementellen Backup verändert haben. So entsteht eine genaue Übersicht darüber, welche Blöcke in das aktuelle, inkrementelle Backup auf Blockebene aufgenommen werden müssen. Eine Incremental-Forever-Backup-Lösung auf Blockebene muss auch den Standort der einzelnen Blöcke nach der Sicherung tracken, weil sie diese Informationen im Falle einer Wiederherstellung benötigt. Obwohl nicht ausschließlich in Virtualisierungsumgebungen zu finden, werden Lösungen dieser Art in der Regel dort eingesetzt.

Die Vorteile der Forever-Backups auf Block-Ebene: Die Datenmenge, die vom Backup-Client zum Backup-Server übertragen werden muss, wird erheblich reduziert, was bei der Sicherung von Remote-Systemen nützlich sein kann. Einige Backup-Lösungen, die für Laptops und Remote-Büros entwickelt wurden, verwenden einen inkrementellen Forever-Backup-Ansatz. Die Herausforderung besteht dabei darin, dass der CBT-Prozess von irgendetwas bereitgestellt werden muss - und nicht jedes System ist dazu in der Lage. Diese Art von Sicherungsprozess funktioniert nur mit Disk-basierten Festplatten, da eine einzelne Datei im Fall eines Bandmediums auf mehrere Bänder verteilt werden könnte - eine Wiederherstellung würde damit ewig dauern.

Der inkrementelle Ansatz auf Blockebene ist wahrscheinlich der populärste der hier vorgestellten Methoden zur Forever-Datensicherung und verbraucht weniger Rechenressourcen als Source Deduplication - funktioniert aber nur, wenn CBT verfügbar ist.

3. Datensicherung mit Source Deduplication

Die letzte Art der inkrementellen Forever-Datensicherung wird als Source Deduplication Software bezeichnet. Bei diesem Ansatz steht der Deduplizierungsprozess ganz am Anfang der Datensicherung (also an der Quelle). Die Entscheidung darüber, ob ein neues Datenpaket an das Backup-System übertragen werden soll oder nicht, wird am Backup-Client getroffen. Dieser Incremental-Forever-Backup-Ansatz ist so konzipiert, dass bekannte Daten-"Chunks" nicht noch einmal gesichert werden. Ein Chunk bezeichnet dabei eine Sammlung von Bytes beliebiger Größe. Das kann dazu führen, dass sogar noch weniger Daten gesichert werden als beim Block-Level-Ansatz.

Weil Source-Deduplication-Systeme die Datenmenge, die vom Backup-Client zur Backup-Lösung gesichert wird, stärker reduziert als jeder andere Ansatz, ist Source Deduplication auch der effizienteste Weg, wenn es darum geht, Remote-Systeme zu sichern. Deswegen nutzen auch die allermeisten Datensicherungs-Lösungen mit Remote-Fokus Source Deduplication. Der größte Nachteil dieses Ansatzes besteht darin, dass möglicherweise Änderungen an Ihrer Backup-Software nötig werden, um ihn nutzen zu können.

Der Source-Deduplication-Ansatz ist im Vergleich zum File-Level- und Block-Level-Konzept universeller einsetzbar - aber nicht sonderlich weit verbreitet.

Dieser Beitrag basiert auf einem Artikel unserer US-Schwesterpublikation Network World.