Il rapporto di deduplicazione mostra le dimensioni degli archivi in un deposito di deduplicazione rispetto alle dimensioni che occuperebbero in un deposito senza deduplicazione.
Ad esempio, supponiamo di eseguire il backup di due file di contenuto identico da due macchine. Se la dimensione di ogni file è un gigabyte, la dimensione dei backup in un deposito senza deduplicazione sarà pari a circa 2 GB; in un deposito di deduplicazione, tale dimensione sarà limitata a circa 1 GB. Questo indica un rapporto di deduplicazione di 2:1, ovvero del 50%.
Al contrario, se due file hanno contenuti differenti, le dimensioni dei backup in un deposito senza deduplicazione e in un deposito di deduplicazione saranno le stesse (2 GB) e il rapporto di deduplicazione sarà 1:1, ovvero del 100%.
Rapporti previsti
Anche se in alcune situazioni il rapporto di deduplicazione può essere molto elevato (nell'esempio precedente, aumentando il numero di macchine il rapporto diventa 3:1, 4:1, ecc.), una previsione ragionevole per un ambiente tipico è un rapporto compreso tra 1,2:1 e 1,6:1.
Per un esempio più realistico, supponiamo di eseguire un backup a livello di file o a livello di disco di due macchine con dischi simili. In ogni macchina, i file comuni a tutte le macchine occupano il 50% dello spazio del disco (ad esempio 1 GB); i file specifici di ogni macchina occupano l'altro 50% (ancora 1 GB).
In un deposito di deduplicazione, la dimensione del backup della prima macchina in questo caso sarà 2 GB e quella della seconda macchina sarà 1 GB. In un deposito senza deduplicazione, i backup occuperebbero in totale 4 GB. Il rapporto di deduplicazione, quindi, sarebbe 4:3 o circa 1,33:1.
Analogamente, nel caso di tre macchine, il rapporto diventa 1,5:1; per quattro macchine è 1,6:1. Si avvicina a 2:1 all'aumentare delle macchine che eseguono il backup nello stesso deposito. Ciò significa che è possibile acquistare, ad esempio, una periferica di archiviazione da 10 TB invece di una da 20 TB.
L'entità effettiva della riduzione della capacità dipende da numerosi fattori, ad esempio il tipo di dati che vengono sottoposti a backup, la frequenza del backup e il periodo di conservazione dei backup.