Meilleures pratiques pour la déduplication

La déduplication est un processus complexe qui dépend de nombreux facteurs.

Les facteurs les plus importants qui ont une incidence sur la vitesse de déduplication sont :

Pour augmenter la performance de la déduplication, suivez les recommandations ci-dessous.

Placez la base de données de déduplication et l'emplacement de stockage de la déduplication sur des périphériques physiques séparés

Pour augmenter la vitesse d'accès à une base de données de déduplication, la base de données et l'emplacement de stockage doivent être situés sur des périphériques physiques différents.

Il vaut mieux allouer des périphériques dédiés pour l'emplacement de stockage et la base de données. Si ce n'est pas possible, du moins ne placez pas un emplacement de stockage ou une base de données sur le même disque avec le système d'exploitation. La raison est que le système d'exploitation exécute un grand nombre d'opérations de lecture/écriture sur le disque dur, ce qui ralentit sensiblement la déduplication.

Sélection d'un disque pour une base de données de déduplication

S = U / 64 + 10

S – taille du disque, en GO

U – quantité prévue de données uniques dans le magasin de données de déduplication, en GO.

Par exemple, si la quantité prévue de données uniques dans le magasin de données de déduplication est U=5 TO, la base de données de déduplication nécessitera un espace libre d'au moins

S = 5*1024 / 64 + 10 = 90 GO

Sélection d'un disque pour un emplacement de stockage de déduplication

Dans le but d'empêcher une perte de données, nous conseillons d'utiliser RAID 10, 5 ou 6. RAID 0 n'est pas conseillé puisqu'il n'est pas insensible aux défaillances. RAID 1 n'est pas conseillé à cause de sa vitesse relativement faible. Il n'y a pas de préférence pour les disques locaux ou le SAN, les deux sont bons.

8 GO de RAM par 1 TO de données uniques

C'est une recommandation pour le pire scénario possible. Il n'est pas nécessaire de la suivre si vous n'avez pas de problème de performance de déduplication. Cependant, si la déduplication s'exécute trop lentement, vérifiez le paramètre Espace occupé de l'emplacement de stockage de déduplication. En ajoutant davantage de mémoire RAM au noeud de stockage, vous pouvez élever sensiblement la vitesse de déduplication.

En règle généralé, plus vous avez de RAM, plus la taille de la base de données de déduplication peut être grande, à condition que la vitesse de déduplication soit la même.

Uniquement un emplacement de stockage de déduplication sur chaque noeud de stockage

Il est vivement recommandé que vous ne créiez qu'un emplacement de stockage de déduplication sur un noeud de stockage. Sinon, tout le volume de la RAM disponible sera réparti proportionnellement au nombre d'emplacements de stockage.

Système d'exploitation 64 bits

Pour une performance de déduplication optimale, installez le noeud de stockage sur un système d'exploitation de 64 bits. La machine ne doit pas exécuter des applications qui nécessitent beaucoup de ressources système ; par exemple, des systèmes de gestion de bases de données (DBMS) ou des systèmes de planification de ressources d'entreprise (ERP).

Processeur multi-noyau avec une vitesse d'horloge d'au moins 2,5 GHz

Nous vous conseillons d'utiliser un processeur avec au moins quatre noyaux et une vitesse d'horloge d'au moins 2,5 GHz.

Espace libre suffisant dans l'emplacement de stockage

L'indexation d'une sauvegarde nécessite autant d'espace libre que les données de sauvegarde occuperont immédiatement après les avoir enregistrées sur l'emplacement de stockage. Sans une compression ou une déduplication à la source, cette valeur est égale à la taille des données d'origine sauvegardées pednant l'opération de sauvegarde donnée.

LAN haute vitesse

On recommande un LAN d'un Gbit. Cela permettra au logiciel d'exécuter 5 à 6 sauvegardes avec une déduplication en parallèle sans réduire considérablement la vitesse.

Sauvegardez une machine typique avant de sauvegarder plusieurs mahcines ayant un contenu similaire

Lorsque vous sauvegardez plusieurs machines ayant un contenu similaire, on vous recommande de sauvegarder d'abord une machine et d'attendre la fin de l'indexation des données sauvegardées. Après cela, les autres machines seront sauvegardées plus vite en raison de la déduplicaiton efficace. Du fait que la sauvegarde de la première machine a été indexée, la plupart des données sont déjà dans le magasin de données de déduplication.

Sauvegardez différentes machines à des moments différents

Si vous sauvegardez un grand nombre de machines, étalez les opérations de sauvegarde dans le temps. Pour ce faire, créez plusieurs plans de sauvegarde avec plusieurs planifications.

Configurez des notifications d'alerte

On vous recommande de configurer les notifications d'alerte pour les « Emplacements de stockage » dans les options du serveur de gestion. Ceci peut vous aider à réagir promptement dans des cas de dérangement. Par exemple, une réaction au bon moment à une alerte « Emplacement de stockage comportant un espace disque faible » peut empêcher une erreur lors de la prochaine sauvegarde sur l'emplacement de stockage.