Mejores prácticas de deduplicación

La deduplicación es un proceso complejo que depende de muchos factores.

Los factores más importantes que tienen influencia sobre la velocidad de la deduplicación son:

Para incrementar el rendimiento de la deduplicación, siga las recomendaciones a continuación.

Coloque la base de datos de deduplicación y la bóveda de deduplicación en dispositivos físicos separados

Para incrementar la velocidad de acceso a una base de datos de deduplicación, la base de datos y la bóveda deben estar ubicadas en dispositivos físicos separados.

Es mejor designar dispositivos dedicados para la bóveda y la base de datos. Si esto no es posible, al menos no coloque una bóveda o base de datos en el mismo disco con el sistema operativo. El motivo es que el sistema operativo realiza una gran cantidad de operaciones de lectura/escritura en el disco duro, lo que ralentiza en gran medida la deduplicación.

Selección de un disco para una base de datos de deduplicación

S = U / 32 + 10

en donde

S – tamaño del disco, en GB

U – cantidad planificada de datos únicos en el almacén de datos de deduplicación, en GB.

Por ejemplo, si la cantidad planificada de datos únicos en el almacén de datos de deduplicación es U=5 TB, la base de datos de deduplicación necesitará un espacio de disco libre no inferior a

S = 5*1024 / 32 + 10 = 170 GB

Selección de un disco para una bóveda de deduplicación

Para el fin de evitar la pérdida de datos, le recomendamos utilizar RAID 10, 5 o 6. RAID 0 no es recomendable porque no es tolerante a los fallos. RAID 1 no es recomendable debido a su velocidad relativamente baja. No existe preferencia sobre discos locales o SAN, ambos son adecuados.

8 GB de RAM por 1 TB de datos únicos

Esta es la recomendación para una situación de peor caso. No es necesario seguirlo si no experimenta un problema de rendimiento de la deduplicación. Sin embargo, si la deduplicación se realiza muy lentamente, marque el parámetro Espacio ocupado de la bóveda de deduplicación. Al añadir más RAM al nodo de almacenamiento, puede aumentar significativamente la velocidad de deduplicación.

En general, cuanta más RAM tenga, mayor puede ser el tamaño de la base de datos de deduplicación, siempre que la velocidad de deduplicación sea la misma.

Solo una bóveda de deduplicación en cada nodo de almacenamiento

Es altamente recomendable que cree solo una bóveda de deduplicación en un nodo de almacenamiento. De lo contrario, todo el volumen de RAM disponible se distribuirá en proporción a la cantidad de bóvedas.

Sistema operativo de 64 bits

Para un rendimiento óptimo de la deduplicación, instale el nodo de almacenamiento en un sistema operativo de 64 bits. El equipo no debe ejecutar aplicaciones que necesiten muchos recursos del sistema; por ejemplo, sistemas de gestión de bases de datos (DBMS) o sistemas de planificación de recursos empresariales (ERP).

Procesador de varios núcleos con al menos 2,5 GHz de frecuencia del reloj

Le recomendamos utilizar un procesador con un número de núcleos no inferior a 4 y una frecuencia del reloj no inferior a 2,5 GHz.

Espacio libre suficiente en la bóveda

La indexación de la copia de seguridad necesita tanto espacio libre como ocupan los datos incluidos en la copia de seguridad inmediatamente después de guardarse en la bóveda. Sin una compresión o deduplicación en el origen, este valor es igual al tamaño original de los datos incluidos en la copia de seguridad durante la operación de copia de seguridad dada.

LAN de alta velocidad

Se recomienda una LAN de 1 Gbit. Permite que el software realice 5-6 copias de seguridad con deduplicación en paralelo y la velocidad no disminuirá considerablemente.

Copia de seguridad de un equipo típico antes de la copia de seguridad de varios equipos con contenido similar

Al realizar la copia de seguridad de varios equipos con contenido similar, es recomendable que realice la copia de seguridad de un equipo primero y espere hasta que finalice la indexación de los datos incluidos en la copia de seguridad. Después de esto, los demás equipos se incluirán en la copia de seguridad más rápidamente debido a una eficaz deduplicación. Como la copia de seguridad del primer equipo se ha indexado, la mayoría de los datos ya se encuentran en el almacén de datos de deduplicación.

Copia de seguridad de distintos equipos en diferentes momentos

Si realiza la copia de seguridad de un gran número de equipos, divida la s operaciones de copia de seguridad en el tiempo. Para esto, cree varios planes de copias de seguridad con varias programaciones.

Usar la catalogación rápida

La indexación de una copia de seguridad comienza después de completar su catalogación. Para reducir el tiempo total requerido para el procesamiento de una copia de seguridad, cambie la catalogación automática al modo rápido. Puede comenzar con la catalogación completa de forma manual fuera de la ventana de la copia de seguridad.

Configurar las notificaciones de alerta

Es recomendable que configure notificación de alertas de la "bóveda" en las opciones del servidor de gestión. Esto puede ayudarle a reaccionar rápidamente en situaciones de problemas. Por ejemplo, una reacción a tiempo a la alerta "Hay una bóveda con poco espacio libre" puede evitar un error al realizar la siguiente copia de seguridad en la bóveda.