La deduplicación es el proceso de minimizar el espacio de almacenamiento que ocupan los datos por medio de la detección de la repetición de los datos y el almacenamiento de los datos idénticos una sola vez.
La deduplicación reduciría también la carga de la red: si, durante una copia de seguridad, se encuentran datos que son duplicados de los ya almacenados, su contenido no se transfiere a la red.
Acronis Backup & Recovery 11.5 deduplicará las copias de seguridad guardadas en una bóveda gestionada si habilita la deduplicación durante la creación de la bóveda. Una bóveda en la que la deduplicación está activa se denomina bóveda de deduplicación. El complemento de deduplicación del agente debe instalarse en cada equipo que realiza una copia de seguridad en dicha bóveda. Sin el complemento, la copia de seguridad en la bóveda no es posible.
La deduplicación se realiza en los bloques de datos. El tamaño del bloque es 4 KB para las copias de seguridad a nivel de disco y de 1 B a 256 KB para las copias de seguridad de nivel de archivos. Cada archivo que tiene menos de 256 KB se considera un bloque de datos. Los archivos superiores a 256 KB se dividen en bloques de 256 KB.
Acronis Backup & Recovery 11.5 realiza la deduplicación en dos pasos:
Desduplicación en el origen
Realizada por un equipo gestionado durante la copia de seguridad. El agente utiliza el nodo de almacenamiento para determinar qué datos pueden deduplicarse y no transfiere los bloques de datos cuyos duplicados ya están presentes en la bóveda.
Desduplicación en el destino
Realizada en la bóveda cuando se ha completado una copia de seguridad. El nodo de almacenamiento analiza el contenido y deduplica los datos en la bóveda.
Cuando se crea un plan de copias de seguridad, es posible desactivar la deduplicación en el origen para ese plan. En este caso, las copias de seguridad serán más rápidas pero se generará una mayor carga en la red y en el nodo de almacenamiento.
Base de datos de desduplicación
Acronis Backup & Recovery 11.5 Storage Node gestiona una bóveda de deduplicación, conserva la base de datos de deduplicación, la cual contiene los valores hash de todos los bloques de datos almacenados en la bóveda, excepto de aquellos que no se pueden deduplicar, como los archivos cifrados.
La base de datos de deduplicación se almacena en la carpeta local del nodo de almacenamiento. Puede especificar la ruta de la base de datos al crear la bóveda.
El tamaño de la base de datos de deduplicación constituye aproximadamente un 1,5 por ciento del tamaño total de los datos únicos almacenados en la bóveda. En otras palabras, por cada terabyte de nuevos datos (no duplicados) añadidos, se añaden 15 GB a la base de datos.
si la base de datos está dañada o el nodo de almacenamiento se pierde, a pesar de que la bóveda conserva su contenido, el nuevo nodo de almacenamiento vuelve a escanear la bóveda y vuelve a crear la base de datos de la bóveda y después la base de datos de deduplicación.