La deduplicazione è un processo con cui si riduce al minimo lo spazio di archiviazione occupato dai dati, grazie alla rilevazione delle ripetizioni dei dati e all'archiviazione di dati identici una sola volta.
La deduplicazione, inoltre, può ridurre il carico della rete: se durante un backup si scopre che alcuni dati sono il duplicato di dati già archiviati, il relativo contenuto non viene trasferito nella rete.
Acronis Backup deduplicherà i backup salvati in un deposito gestito se si abilita la deduplicazione durante la creazione del deposito. Un deposito in cui è abilitata la deduplicazione viene detto deposito di deduplicazione.
La deduplicazione viene eseguita sui blocchi di dati. Le dimensioni del blocco possono variare da 1 B a 256 KB sia per i backup a livello di disco che per i backup a livello di file.
Acronis Backup esegue la deduplicazione in due passaggi:
Deduplicazione nell'origine
Viene eseguita in una macchina gestita durante il backup. L'agente utilizza il nodo di archiviazione per determinare i dati che è possibile deduplicare e non trasferisce i blocchi di dati i cui duplicati sono già presenti nel deposito.
Deduplicazione nella destinazione
Viene eseguita nel deposito al termine di un backup. Il nodo di archiviazione analizza il contenuto del deposito ed esegue la deduplicazione dei dati nel deposito.
Quando viene creato un piano di backup, per tale piano è possibile disattivare la deduplicazione nell'origine. In tal modo è possibile velocizzare i backup, anche se il carico sulla rete e sul nodo di archiviazione è maggiore.
Database di deduplicazione
Acronis Backup Storage Node gestisce un database di deduplicazione, che contiene i valori hash di tutti i blocchi di dati archiviati nel deposito, tranne quelli che non è possibile deduplicare, ad esempio i file crittografati.
Il database di deduplicazione è conservato nella cartella locale del nodo di archiviazione. È possibile specificare il percorso del database durante la creazione del deposito. Per ridurre al minimo la durata dell'accesso al database, è necessario archiviarlo su una periferica collegata direttamente anziché su un volume di rete montato. Per ulteriori suggerimenti, vedere "Best practice per la deduplicazione".
Le dimensioni del database di deduplicazione sono pari al 0,05% circa della dimensione totale dei dati univoci archiviati nel deposito. In altre parole, ogni terabyte di nuovi dati (non duplicati) aggiunge circa 0,5 GB al database.
Se il database è danneggiato o il nodo di archiviazione va perduto, mentre il deposito conserva il proprio contenuto, il nuovo nodo di archiviazione analizza nuovamente il deposito e crea nuovamente il database del deposito e poi il database di deduplicazione.