Comment fonctionne la déduplication

La déduplication à la source

Lors de l'exécution d'une sauvegarde sur un emplacement de stockage de déduplication, l'agent Acronis Backup & Recovery 10 lit les éléments en cours de sauvegarde — blocs de disques pour sauvegarde de disque ou de fichiers pour sauvegarde de fichiers — et calcule l'empreinte digitale de chaque bloc. Une telle empreinte digitale, souvent appelée valeur hash, représente uniquement le contenu de l'élément dans l'emplacement de stockage.

Avant d'envoyer l'élément dans l'emplacement de stockage, l'agent envoie une requête à la base de données de déduplication pour déterminer si la valeur hash de l'élément est la même que celle d'un élément déjà stocké.

Si c'est le cas, l'agent n'envoie que la valeur hash de l'élément ; sinon, il envoie l'élément lui-même.

Certains éléments, tels que les fichiers chiffrés ou les blocs de disques de taille non régulière, ne peuvent pas être dédupliqués, et l'agent transfère toujours de tels éléments sur l'emplacement de stockage sans calculer leur valeur hash. Pour plus d'informations sur les restrictions de déduplication de niveau fichier et de niveau disque, consultez Restrictions de déduplication.

La déduplication à la cible

Une fois la sauvegarde sur un emplacement de stockage de déduplication terminée, le nœud de stockage exécute la tâche d'indexation pour dédupliquer les données dans l'emplacement de stockage comme suit :

  1. Il déplace les éléments (blocs de disques ou fichiers) à partir des archives vers un fichier spécial au sein de l'emplacement de stockage, en n'y stockant les éléments en double qu'une seule fois. Ce fichier est appelé le magasin de données de déduplication. S'il y a à la fois des sauvegardes de niveau disque et de niveau fichier dans l'emplacement de stockage, il existe deux magasins de données pour celles-ci. Les éléments ne pouvant pas être dédupliqués restent dans les archives.
  2. Dans les archives, il remplace les éléments déplacés par des références correspondant à ces éléments.

Par conséquent, l'emplacement de stockage contient un certain nombre d'éléments dédupliqués uniques, avec chaque élément ayant une ou plusieurs références dans les archives de l'emplacement de stockage.

La tâche d'indexation peut prendre un temps considérable à s'exécuter. Vous pouvez voir l'état de cette tâche dans la vue Tâches sur le serveur de gestion.

Compactage

Une fois qu'une ou plusieurs sauvegardes ou archives ont été supprimées de l'emplacement de stockage — manuellement ou pendant le nettoyage — l'emplacement de stockage peut contenir des éléments qui n'ont plus aucune référence dans les archives. De tels éléments sont supprimés par la tâche de compactage, qui est une tâche planifiée exécutée par le nœud de stockage.

Par défaut, la tâche de compactage est exécutée chaque dimanche soir à 03:00. Vous pouvez re-planifier la tâche comme décrit dans la section Actions sur les nœuds de stockage, sous « Modifier la planification de la tâche de compactage ». Vous pouvez également démarrer ou arrêter la tâche manuellement à partir de la vue Tâches.

Parce que la suppression des éléments inutilisés utilise beaucoup de ressources, la tâche de compactage s'exécute uniquement lorsqu'une quantité de données significative s'est accumulée. Le seuil est déterminé par le paramètre de configuration Seuil de déclenchement du compactage.