Funzionamento della deduplicazione

Deduplicazione nell'origine

Quando viene eseguito un backup in un deposito di deduplicazione, Acronis Backup & Recovery 10 Agent legge gli elementi che vengono sottoposti a backup (blocchi del disco per backup del disco o file per backup di file) e calcola un'impronta digitale di ogni blocco. Tale impronta digitale, spesso detta valore hash, rappresenta in maniera univoca il contenuto dell'elemento nel deposito.

Prima di inviare l'elemento al deposito, l'agente interroga il database di deduplicazione per stabilire se il valore hash dell'elemento corrisponde a quello di un elemento già archiviato.

In tal caso, l'agente invia solo il valore hash dell'elemento; in caso contrario, invia l'elemento stesso.

Alcuni elementi, ad esempio file crittografati o blocchi disco di dimensioni non standard, non possono essere deduplicati, e l'agente trasferisce tali elementi al deposito in ogni caso, senza calcolarne i valori hash. Per ulteriori informazioni sulle limitazioni della deduplicazione a livello di file o a livello del disco, vedere Limitazioni della deduplicazione.

Deduplicazione nella destinazione

Al termine di un backup in un deposito di deduplicazione, il nodo di archiviazione esegue l'attività di indicizzazione per deduplicare i dati nel deposito mediante le operazioni descritte di seguito:

  1. Sposta gli elementi (file o blocchi del disco) dagli archivi in un file speciale nel deposito, che memorizza gli elementi duplicati una sola volta. Questa cartella viene detta archivio dei dati di deduplicazione. Se nel deposito sono presenti sia backup a livello di file che a livello del disco, sono presenti due archivi dei dati separati. Gli elementi che non possono essere deduplicati rimangono negli archivi.
  2. Negli archivi, sostituisce gli elementi spostati con i corrispondenti riferimenti ad essi.

Di conseguenza, il deposito contiene numerosi elementi univoci deduplicati, ognuno dei quali ha uno o più riferimenti a se stesso dagli archivi del deposito.

Il completamento dell'attività di indicizzazione potrebbe richiedere molto tempo. È possibile visualizzare lo stato di questa attività nella visualizzazione Attività nel server di gestione.

Compattazione

Dopo l'eliminazione dal deposito di uno o più backup o archivi, manualmente o durante la pulizia, il deposito può contenere elementi a cui non si fa più riferimento da nessun archivio. Tali elementi vengono eliminati dall'attività di compattazione, che consiste in un'attività pianificata eseguita dal nodo di archiviazione.

Per impostazione predefinita, l'attività di compattazione viene eseguita ogni Domenica notte alle ore 03:00. L'attività può essere pianificata nuovamente come descritto in Azioni sui nodi di archiviazione, in "Modificare la pianificazione dell'attività di compattazione". L'attività può essere anche avviata o interrotta manualmente dalla visualizzazione Attività.

Poiché l'eliminazione di elementi inutilizzati richiede molte risorse, l'attività di compattazione viene eseguita solo quando è stata accumulata una quantità di dati sufficiente. La soglia viene stabilita dal parametro di configurazione Soglia di attivazione della compattazione.