Überblick

Deduplizierung ist ein Prozess zur Minimierung von durch Daten belegten Speicherplatz, indem Daten-Wiederholungen erkannt werden und identische Daten nur noch einmal gespeichert werden.

Deduplizierung kann außerdem die Netzwerklast reduzieren: Sollte während eines Backups Daten gefunden werden, die Duplikate von bereits gespeicherten Daten sind, so wird ihr Inhalt nicht noch einmal über das Netzwerk übertragen.

Acronis Backup wird zu einem verwalteten Depot gespeicherte Backups nur dann deduplizieren, falls Sie während der Depot-Erstellung die Deduplizierungsfunktion aktiviert haben. Ein Depot mit aktivierter Deduplizierung wird deduplizierendes Depot genannt.

Das Objekt der Deduplizierung sind Datenblöcke. Die Blockgröße variiert von 1 B bis 256 KB (sowohl für Laufwerk- wie auch Datei-basierte Backups).

Eine Deduplizierung wird von Acronis Backup in zwei Schritten durchgeführt:

Deduplizierung an der Quelle

Die Durchführung erfolgt während eines Backups auf einer verwalteten Maschine. Der Agent verwendet den Storage Node, um zu bestimmen, welche Daten dedupliziert werden können und überträgt dann keine Datenblöcke mehr, deren Duplikate bereits im Depot vorliegen.

Deduplizierung am Ziel

Durchführung im Depot nach Fertigstellung eines Backups. Der Storage Node analysiert den Inhalt des Depots und dedupliziert dann die dort befindlichen Daten.

Sie erhalten beim Erstellen eines Backup-Plans die Option, die Deduplizierung an der Quelle auszuschalten. Das kann zu schnelleren Backups führen, aber auch zu größerer Last für das Netzwerk und den Storage Node.

Deduplizierungsdatenbank

Ein Acronis Backup Storage Node verwaltet die Deduplizierungsdatenbank, welche die Hash-Werte aller im Depot vorliegenden Datenblöcke enthält (mit Ausnahme solcher, die nicht deduplizierbar sind, beispielsweise verschlüsselte Dateien).

Die Deduplizierungsdatenbank wird in einem lokalen Ordner des Storage Nodes gespeichert. Sie können den Pfad zur Datenbank bei Erstellung des Depots spezifizieren. Um eine niedrige Zugriffszeit für die Datenbank zu gewährleisten, sollten Sie diese auf einem direkt angeschlossenen Laufwerk speichern (statt beispielsweise auf einem Netzwerk-Volume). Weitere Empfehlungen finden Sie im Abschnitt 'Optimale Vorgehensweisen bei der Deduplizierung'.

Die Größe einer Deduplizierungsdatenbank beträgt ungefähr 0.05 Prozent der Gesamtgröße aller im Depot gespeicherten 'einmaligen Daten'. Mit anderen Worten, jedes Terabyte an neuen (nicht doppelten) Daten fügt der Datenbank ca. 0.5 GB hinzu.

Sollte eine Datenbank beschädigt sein oder der Storage Node verloren gehen, während der Inhalt des Depots bestehen bleibt, so scannt der neue Storage Node das Depot und erstellt die Datenbank wieder neu.