So funktioniert Deduplizierung

Deduplizierung an der Quelle

Bei Durchführung eines Backups zu einem deduplizierenden Depot liest der Acronis Backup & Recovery 10 Agent die gesicherten Elemente (Disk-Datenblöcke bei Disk-Backup oder Dateien bei File-Backup) und kalkuliert dann für jeden Block einen Fingerabdruck. Ein solcher Fingerabdruck, auch Hash-Wert genannt, repräsentiert den Inhalt des jeweiligen Elements innerhalb des Depots.

Bevor ein Element zum Depot übertragen wird, fragt der Agent die Deduplizierungs-Datenbank ab, um zu bestimmen, ob der Hash-Wert dieses Elements identisch zu einem bereits gespeicherten Element ist.

Wenn dem so ist, so überträgt der Agent nur den Hash-Wert des Elementes, wenn nicht, so wird das Element selbst übertragen.

Einige Elemente (z.B. verschlüsselte Dateien oder Disk-Datenblöcke mit einer vom Standard abweichenden Größe) können nicht dedupliziert werden, weswegen der Agent solche Elemente auch ohne Hash-Wert-Kalkulation zum Depot überträgt. Mehr Informationen über die Beschränkung von Deduplizierung auf Datei- und Disk-Ebene finden Sie unter Deduplizierungs-Beschränkungen.

Deduplizierung auf dem Ziel

Nachdem die Sicherung auf einem deduplizierenden Depot abgeschlossen ist, führt der Storage Node den Indizierungs-Task zur Deduplizierung von Daten in dem Depot wie folgt aus:

  1. Er verschiebt die Elemente (Laufwerksblöcke oder Dateien) aus den Archiven in eine spezielle Datei innerhalb des Depots, wo doppelt vorhandene Elemente dann nur noch einmal gespeichert werden. Diese Datei wird Deduplizierungs-Datenspeicher genannt. Sind im Depot sowohl Laufwerk- wie auch Datei-basierte Backups vorhanden, dann gibt es für diese zwei separate Datenspeicher. Nicht-deduplizierbare Elemente verbleiben in den Archiven.
  2. In den Archiven ersetzt der Storage Node die verschobenen Elemente durch einen mit ihnen korrespondierenden Verweis.

Als Ergebnis enthält das Depot eine gewisse Zahl einmaliger, deduplizierter Elemente, wobei jedes Element einen oder mehrere zu ihm gehörende Verweise in den Archiven des Depots hat.

Die Indizierung kann einige Zeit dauern. Sie können den Fortschritt des Tasks in der Ansicht Tasks auf dem Management Server einsehen.

Verdichten

Wurden ein oder mehrere Backups bzw. Archive vom Depot gelöscht (entweder manuell oder durch Bereinigung), so kann das Depot Elemente enthalten, die sich nicht mehr auf irgendwelche Archive beziehen. Solche Elemente werden dann durch einen Verdichtungs-Task gelöscht, bei dem es sich um einen geplanten, vom Storage Node ausgeführten Task handelt.

Als Standardvorgabe läuft der Verdichtungs-Task jeweils sonntags in der Nacht um 03:00 Uhr. Sie können die Planung des Tasks ändern, wie unter Aktionen für Storage Nodes (Abschnitt „Die Planung des Verdichtungs-Task ändern“) beschrieben. Sie können den Task außerdem manuell starten oder stoppen – und zwar in der Ansicht Tasks.

Da das Löschen unbenutzter Elemente ein Ressourcen verbrauchender Prozess ist, wird der Verdichtungs-Task nur ausgeführt, wenn sich eine ausreichende Datenmenge angesammelt hat. Der Grenzwert wird über den Konfigurationsparameter Compacting Trigger Threshold bestimmt.