Deduplikacja to proces minimalizowania miejsca zajmowanego przez dane w pamięci masowej, polegający na wykrywaniu powtarzających się danych i zachowywaniu tylko jednego egzemplarza identycznych elementów.
Deduplikacja umożliwia również zmniejszenie obciążenia sieci: jeśli podczas tworzenia kopii zapasowej program wykryje dane będące duplikatami już przechowywanych danych, jego zawartość nie będzie przesyłana przez sieć.
Program Acronis Backup zdeduplikuje kopie zapasowe zapisane w skarbcu zarządzanym, jeśli włączysz deduplikację podczas tworzenia skarbca. Skarbiec z włączoną deduplikacją nazywa się skarbcem deduplikacji.
Deduplikacja przeprowadzana jest na blokach danych. W przypadku kopii zapasowych na poziomie dysku i kopii zapasowych na poziomie plików taki blok ma rozmiar od 1 B do 256 KB.
Program Acronis Backup przeprowadza deduplikację w dwóch krokach:
Deduplikacja w źródle
Jest to deduplikacja wykonywana na komputerze zarządzanym podczas tworzenia kopii zapasowej. Agent wykorzystuje węzeł magazynowania do ustalenia, jakie dane poddać deduplikacji i nie przesyła bloków danych, których duplikaty już znajdują się w skarbcu.
Deduplikacja w miejscu docelowym
Wykonywana w skarbcu po ukończeniu tworzenia kopii zapasowej. Węzeł magazynowania analizuje zawartość skarbca i deduplikuje zawarte w nim dane.
Podczas tworzenia planu tworzenia kopii zapasowych można wyłączyć w tym planie funkcję deduplikacji w miejscu źródłowym. Może to prowadzić do szybszego tworzenia kopii zapasowych, ale jednocześnie — do większego obciążenia sieci i węzła magazynowania.
Baza danych deduplikacji
Węzeł Acronis Backup Storage Node utrzymuje bazę danych deduplikacji, która zawiera wartości skrótów wszystkich bloków danych przechowywanych w skarbcu z wyjątkiem tych, które nie mogą zostać poddane deduplikacji, na przykład plików zaszyfrowanych.
Baza danych deduplikacji jest przechowywana w folderze lokalnym węzła magazynowania. Podczas tworzenia skarbca można określić ścieżkę do bazy danych. Aby maksymalnie skrócić czas dostępu do bazy danych, przechowuj ją bezpośrednio na podłączonym napędzie, a nie w zamontowanym woluminie sieciowym. Aby uzyskać więcej zaleceń, zobacz „Sprawdzone praktyki dotyczące deduplikacji”.
Rozmiar bazy danych deduplikacji wynosi około 0,05 procent całkowitego rozmiaru unikatowych danych przechowywanych w skarbcu. Innymi słowy, każdy terabajt nowych danych (niebędących duplikatami) dodaje około 0,5 GB do bazy danych.
W przypadku uszkodzenia bazy danych lub utracenia węzła magazynowania zawartość skarbca pozostaje nienaruszona, ale nowy węzeł magazynowania ponownie skanuje skarbiec, najpierw odtwarzając bazę danych skarbca, a następnie bazę danych deduplikacji.