Deduplizierungsverhältnis

Das Deduplizierungs-Verhältnis gibt die Größe der Archive in einem deduplizierenden Depot im Verhältnis zu der Größe an, die sie in einem nicht-deduplizierenden Depot belegen würden.

Beispiel: Angenommen, Sie sichern zwei Dateien mit identischem Inhalt von zwei Maschinen. Beträgt die Größe jeder Datei ein Gigabyte, so ist die Größe der Backups in einem nicht-deduplizierenden Depot ungefähr 2 GB, in einem deduplizierenden jedoch nur noch ca. 1 GB. Das ergibt ein Deduplizierungsverhältnis von 2:1 bzw. 50%.

Im umgekehrten Fall, wenn beide Dateien unterschiedliche Inhalte haben, würde die Backup-Größe in den deduplizierenden bzw. nicht-deduplizierenden Depots ungefähr gleich sein (2 GB) – mit einem Deduplizierungsverhältnis von 1:1 oder 100%.

Zu erwartende Verhältniswerte

Obwohl das Deduplizierungs-Verhältnis unter manchen Umständen sehr hoch sein kann (wie im oberen Beispiel, bei Zunahme der Maschinen ergäben sich sogar Verhältnisse von 3:1, 4:1 etc.), liegt unter typischen Umständen eine vernünftige Erwartung bei einem Verhältnis von 1,2:1 und 1,6:1.

Als realistischeres Beispiel sei angenommen, dass Sie ein Backup auf Datei- oder Disk-Ebene von zwei Maschinen mit gleichartigen Festplatten durchführen. Auf beiden Maschinen belegen gemeinsame Dateien 50% des Festplattenplatzes (z.B. 1 GB), während die für jede Maschine spezifischen Dateien die übrigen 50% (zusätzlich 1 GB) einnehmen.

In einem deduplizierenden Depot wird daher die Größe des Backups der ersten Maschine 2 GB betragen, während die Backup-Größe der zweiten Maschine 1 GB sein wird. In einem nicht-deduplizierenden Depot würden die Backups dagegen insgesamt 4 GB belegen. Daraus resultiert ein Deduplizierungsverhältnis von 4:3 bzw. ca. 1,33:1.

In ähnlicher Weise erhalten Sie bei drei Maschinen ein Verhältnis von 1,5:1 und bei vier Maschinen eins von 1,6:1. Es nähert sich 2:1, je mehr solcher Maschinen zum selben Depot gesichert werden. Das bedeutet, dass Sie z.B. ein 10 TB-Speichergerät statt eines mit 20 TB kaufen können.

Die tatsächliche Menge an reduzierter Kapazität wird durch zahlreiche Faktoren beeinflusst, wie etwa der Art der gesicherten Daten, der Backup-Häufigkeit und der Backup-Aufbewahrungsperiode.