Обзор

Дедупликация — это уменьшение объема, занимаемого хранимыми данными, путем выявления повторяющихся идентичных данных и сохранения их только один раз.

Например, если в управляемом хранилище с включенной дедупликацией содержатся две копии одного файла (в одном или разных архивах), то файл сохраняется только один раз, а во второй копии сохраняется ссылка на первую.

Дедупликация также может снизить загруженность сети: если во время резервного копирования обнаружится, что файл или блок данных является дубликатом уже сохраненного, его содержимое не передается по сети.

Дедупликация на уровне блоков работает с блоками данных, а дедупликация на уровне файлов — с файлами при резервном копировании на уровне дисков и файлов соответственно.

В Acronis Backup & Recovery 10 дедупликация выполняется в два шага.

Дедупликация в источнике

Выполняется на управляемой машине во время резервного копирования. Агент Acronis Backup & Recovery 10 использует узел хранения для определения данных, которые можно дедуплицировать, и не переносит данные, копии которых уже есть в хранилище.

Дедупликация в месте назначения

Выполняется в хранилище после завершения резервного копирования. Узел хранения анализирует архивы хранилища и дедуплицирует данные в хранилище.

При создании плана резервного копирования можно отключить для этого плана дедупликацию в источнике. Таким образом сокращается время резервного копирования, но увеличивается нагрузка на сеть и узел хранения.

Дедуплицирующее хранилище

Управляемое централизованное хранилище с включенной дедупликацией называется дедуплицирующим хранилищем. При создании управляемого централизованного хранилища можно включить в нем дедупликацию. Дедуплицирующее хранилище нельзя создать на ленточном устройстве.

База данных дедупликации

Узел хранения Acronis Backup & Recovery 10, который управляет дедуплицирующим хранилищем, содержит базу данных дедупликации, включающую хэш-суммы всех элементов в хранилище, кроме тех, которые не могут быть дедуплицированы, например зашифрованные файлы.

База данных дедупликации хранится в папке, указанной в поле Путь к базе данных представления Создание централизованного хранилища при создании хранилища. Базу данных дедупликации можно создать только в локальной папке.

Размер базы данных дедупликации составляет около одного процента от общего размера архивов в хранилище. Другими словами, каждый терабайт новых данных (не дубликатов) добавляет около 10 ГБ к базе данных.

Если в случае повреждения базы данных или потери узла хранения в хранилище остаются архивы и служебная папка с метаданными, новый узел хранения сканирует хранилище и воссоздает базу данных.