Дедупликация — это уменьшение объема, занимаемого хранимыми данными, путем выявления повторяющихся идентичных данных и сохранения их только один раз.
Например, если в управляемом хранилище с включенной дедупликацией содержатся две копии одного файла (в одном или разных архивах), то файл сохраняется только один раз, а во второй копии сохраняется ссылка на первую.
Дедупликация также может снизить загруженность сети: если во время резервного копирования обнаружится, что файл или блок данных является дубликатом уже сохраненного, его содержимое не передается по сети.
Дедупликация на уровне блоков работает с блоками данных, а дедупликация на уровне файлов — с файлами при резервном копировании на уровне дисков и файлов соответственно.
В Acronis Backup & Recovery 10 дедупликация выполняется в два шага.
Дедупликация в источнике
Выполняется на управляемой машине во время резервного копирования. Агент Acronis Backup & Recovery 10 использует узел хранения для определения данных, которые можно дедуплицировать, и не переносит данные, копии которых уже есть в хранилище.
Дедупликация в месте назначения
Выполняется в хранилище после завершения резервного копирования. Узел хранения анализирует архивы хранилища и дедуплицирует данные в хранилище.
При создании плана резервного копирования можно отключить для этого плана дедупликацию в источнике. Таким образом сокращается время резервного копирования, но увеличивается нагрузка на сеть и узел хранения.
Дедуплицирующее хранилище
Управляемое централизованное хранилище с включенной дедупликацией называется дедуплицирующим хранилищем. При создании управляемого централизованного хранилища можно включить в нем дедупликацию. Дедуплицирующее хранилище нельзя создать на ленточном устройстве.
База данных дедупликации
Узел хранения Acronis Backup & Recovery 10, который управляет дедуплицирующим хранилищем, содержит базу данных дедупликации, включающую хэш-суммы всех элементов в хранилище, кроме тех, которые не могут быть дедуплицированы, например зашифрованные файлы.
База данных дедупликации хранится в папке, указанной в поле Путь к базе данных представления Создание централизованного хранилища при создании хранилища. Базу данных дедупликации можно создать только в локальной папке.
Размер базы данных дедупликации составляет около одного процента от общего размера архивов в хранилище. Другими словами, каждый терабайт новых данных (не дубликатов) добавляет около 10 ГБ к базе данных.
Если в случае повреждения базы данных или потери узла хранения в хранилище остаются архивы и служебная папка с метаданными, новый узел хранения сканирует хранилище и воссоздает базу данных.