La déduplication est un processus complexe qui dépend de nombreux facteurs.
Les facteurs les plus importants qui ont une incidence sur la vitesse de déduplication sont :
Pour augmenter la performance de la déduplication, suivez les recommandations ci-dessous.
Placez la base de données de déduplication et l'emplacement de stockage de la déduplication sur des périphériques physiques séparés
Pour augmenter la vitesse d'accès à une base de données de déduplication, la base de données et l'emplacement de stockage doivent être situés sur des périphériques physiques différents.
Il vaut mieux allouer des périphériques dédiés pour l'emplacement de stockage et la base de données. Si ce n'est pas possible, du moins ne placez pas un emplacement de stockage ou une base de données sur le même disque avec le système d'exploitation. La raison est que le système d'exploitation exécute un grand nombre d'opérations de lecture/écriture sur le disque dur, ce qui ralentit sensiblement la déduplication.
Sélection d'un disque pour une base de données de déduplication
S = U / 32 + 10
où
S – taille du disque, en Go
U – quantité prévue de données uniques dans le magasin de données de déduplication, en Go.
Par exemple, si la quantité prévue de données uniques dans le magasin de données de déduplication est U=5 To, la base de données de déduplication nécessitera un espace libre d'au moins
S = 5*1024 / 32 + 10 = 170 Go
Sélection d'un disque pour un emplacement de stockage dédupliqué
Dans le but d'empêcher une perte de données, nous conseillons d'utiliser RAID 10, 5 ou 6. RAID 0 n'est pas conseillé puisqu'il n'est pas tolérant aux pannes. RAID 1 n'est pas conseillé à cause de sa vitesse relativement faible. Il n'y a pas de préférence pour les disques locaux ou le SAN, les deux sont bons.
3 Go de RAM par 1 To de données uniques
Il n'est pas nécessaire de suivre cette recommandation si vous n'avez pas de problème de performances de déduplication. Toutefois, si la déduplication est trop lente, le fait d'ajouter davantage de mémoire RAM au nœud de stockage peut permettre d'augmenter sensiblement la vitesse de déduplication.
En règle générale, plus vous avez de RAM, plus la taille de la base de données de déduplication peut être grande, à condition que la vitesse de déduplication soit la même.
Uniquement un emplacement de stockage dédupliqué sur chaque nœud de stockage
Il est vivement recommandé que vous créez un seul emplacement de stockage dédupliqué sur un nœud de stockage. Sinon, tout le volume de RAM disponible peut être réparti proportionnellement au nombre d'emplacements de stockage.
Système d'exploitation 64 bits
Le nœud de stockage doit être installé dans un système d'exploitation 64 bits. La machine avec le nœud de stockage ne doit pas exécuter des applications qui nécessitent beaucoup de ressources système ; par exemple, des systèmes de gestion de bases de données (DBMS) ou des systèmes de planification de ressources d'entreprise (ERP).
Processeur multi-noyau avec une vitesse d'horloge d'au moins 2,5 GHz
Nous vous conseillons d'utiliser un processeur avec au moins quatre noyaux et une vitesse d'horloge d'au moins 2,5 GHz.
Espace libre suffisant dans l'emplacement de stockage
L'indexation d'une sauvegarde nécessite autant d'espace libre que les données de sauvegarde occuperont immédiatement après les avoir enregistrées sur l'emplacement de stockage. Sans une compression ou une déduplication à la source, cette valeur est égale à la taille des données d'origine sauvegardées pendant l'opération de sauvegarde donnée.
Réseau local haute vitesse
Un réseau local de 1 Gbit est recommandé. Cela permettra au logiciel d'exécuter 5 à 6 sauvegardes avec une déduplication en parallèle sans réduire considérablement la vitesse.
Sauvegardez une machine typique avant de sauvegarder plusieurs machines ayant un contenu similaire
Lorsque vous sauvegardez plusieurs machines ayant un contenu similaire, nous vous recommandons de sauvegarder d'abord une machine et d'attendre la fin de l'indexation des données sauvegardées. Après cela, les autres machines seront sauvegardées plus vite en raison de la déduplication efficace. Du fait que la sauvegarde de la première machine a été indexée, la plupart des données sont déjà dans le magasin de données de déduplication.
Sauvegardez différentes machines à des moments différents
Si vous sauvegardez un grand nombre de machines, étalez les opérations de sauvegarde dans le temps. Pour ce faire, créez plusieurs plans de sauvegarde avec plusieurs planifications.
Utiliser le catalogage rapide
L'indexation d'une sauvegarde démarre après que son catalogage est achevé. Pour réduire le temps global nécessaire pour le traitement de sauvegarde, faites basculer le catalogage automatique au mode rapide. Vous pouvez démarrer catalogage complet manuellement en dehors du créneau de sauvegarde.
Configurez des notifications d'alerte
On vous recommande de configurer les notifications d'alerte pour les « Emplacements de stockage » dans les options du serveur de gestion. Ceci peut vous aider à réagir promptement dans des cas de dérangement. Par exemple, une réaction au bon moment à une alerte « Emplacement de stockage comportant un espace disque faible » peut empêcher une erreur lors de la prochaine sauvegarde sur l'emplacement de stockage.