La deduplicazione è un processo con cui si riduce al minimo lo spazio di archiviazione occupato dai dati, grazie alla rilevazione delle ripetizioni dei dati e all'archiviazione di dati identici una sola volta.
La deduplicazione, inoltre, può ridurre il carico della rete: se durante un backup si scopre che alcuni dati sono il duplicato di dati già archiviati, il relativo contenuto non viene trasferito nella rete.
Acronis Backup & Recovery 11 deduplicherà i backup salvati in un deposito gestito se si abilita la deduplicazione durante la creazione del deposito. Un deposito in cui è abilitata la deduplicazione viene detto deposito di deduplicazione. Il componente aggiuntivo dell'agente Deduplicazione deve essere installato su ogni macchina che esegue il backup in tale deposito. Senza il componente aggiuntivo, l'esecuzione di backup nel deposito non è possibile.
La deduplicazione viene eseguita sui blocchi di dati. Le dimensioni del blocco sono 4 KB per i backup a livello del disco e da 1 B a 256 KB per i backup a livello di file. Ogni file di dimensioni inferiori a 256 KB è considerato un blocco di dati. I file di dimensioni superiori a 256 KB vengono suddivisi in blocchi da 256 KB.
Acronis Backup & Recovery 11 esegue la deduplicazione in due passaggi:
Deduplicazione nell'origine
Viene eseguita in una macchina gestita durante il backup. L'agente utilizza il nodo di archiviazione per determinare i dati che è possibile deduplicare e non trasferisce i blocchi di dati i cui duplicati sono già presenti nel deposito.
Deduplicazione nella destinazione
Viene eseguita nel deposito al termine di un backup. Il nodo di archiviazione analizza il contenuto del deposito ed esegue la deduplicazione dei dati nel deposito.
Quando viene creato un piano di backup, per tale piano è possibile disattivare la deduplicazione nell'origine. In tal modo è possibile velocizzare i backup, anche se il carico sulla rete e sul nodo di archiviazione è maggiore.
Database di deduplicazione
Acronis Backup & Recovery 11 Storage Node gestendo un deposito di deduplicazione conserva il database di deduplicazione che contiene i valori hash di tutti i blocchi di dati archiviati nel deposito, tranne quelli che non è possibile deduplicare, ad esempio file crittografati.
Il database di deduplicazione è conservato nella cartella locale del nodo di archiviazione. È possibile specificare il percorso del database durante la creazione del deposito.
La dimensione del database di deduplicazione è pari a circa 1,5% della dimensione totale dei dati unici archiviati nel deposito. In altre parole, ogni terabyte di nuovi dati (non duplicati) aggiunge circa 15 GB al database.
Se il database è danneggiato o il nodo di archiviazione va perduto, mentre il deposito conserva il proprio contenuto, il nuovo nodo di archiviazione analizza nuovamente il deposito e crea nuovamente il database del deposito e poi il database di deduplicazione.