Cómo funciona la deduplicación

Deduplicación en el origen

Al realizar una copia de seguridad de una bóveda de deduplicación, el Acronis Backup & Recovery 10 Agent lee los elementos que se están copiando, bloques de disco para la copia de seguridad de los discos o archivos para la copia de seguridad de archivos, y calcula una impresión digital de cada bloque. Dicha impresión digital, generalmente llamada un valor hash, representa únicamente el contenido del elemento dentro de la bóveda.

Antes de enviar el elemento a la bóveda, el agente le pide a la base de datos de deduplicación que determine si el valor hash del elemento es el mismo que el de algún elemento ya almacenado.

Si es así, el agente solo envía el valor hash del elemento; de lo contrario, envía el elemento.

Algunos elementos, como archivos cifrados o bloques de discos de un tamaño no estándar, no pueden deduplicarse y el agente siempre transfiere dichos elementos a la bóveda sin calcular sus valores hash. Para obtener más información acerca de las restricciones de deduplicación a nivel de archivos y a nivel de discos, consulte Restricciones de deduplicación.

Deduplicación en el destino

Una vez se completa la copia de seguridad de una bóveda de deduplicación, el nodo de almacenamiento ejecuta tarea de indexación para deduplicar los datos en la bóveda como se explica a continuación.

  1. Mueve los elementos (bloques del disco o archivos) desde los archivos comprimidos a una carpeta especial dentro de la bóveda, almacenando allí los elementos duplicados sólo una vez. Esta carpeta se denomina almacenamiento de datos de deduplicación. Si ambas copias de seguridad, del nivel del disco y del nivel del archivo están en la bóveda, habrá para ellas dos almacenamientos de datos separados. Los elementos que no pueden deduplicarse permanecen en los archivos comprimidos.
  2. En los archivos comprimidos, reemplaza los elementos movidos por las referencias correspondientes que conducen a los mismos.

Como resultado, la bóveda contiene una cantidad de elementos deduplicados y únicos, cada uno con una o más referencias desde los archivos comprimidos de la bóveda.

Es posible que la tarea de indexación necesite un tiempo considerable para completarse. Puede ver el estado de esta tarea en la vista Tareas del management server.

Compactando

Después de que se borren una o más copias de seguridad o archivos comprimidos de la bóveda, ya sea manualmente o durante la limpieza, la bóveda puede contener elementos que ya no tienen referencia desde ningún archivo comprimido. Dichos elementos serán eliminados por la tarea de compactación, la cual es una tarea programada llevada a cabo por el nodo de almacenamiento.

De manera predeterminada, la tarea de compactación se ejecuta cada sábado por la noche a las  03:00am.Puede reprogramar la tarea como se describe en Acciones en nodos de almacenamiento, bajo "Cambiar la programación de la tarea compactada". También puede iniciar o detener la tarea manualmente desde la vista Tareas.

Debido a que la eliminación de elementos no utilizados consume recursos, la tarea de compactación la realiza únicamente cuando se ha acumulado una cantidad de datos suficiente para eliminar. El umbral viene determinado por el parámetro de configuración Umbral de inicio de compactación.