Zasada działania deduplikacji

Deduplikacja w źródle

Podczas tworzenia kopii zapasowej w skarbcu deduplikacji, komponent Acronis Backup Agent oblicza wartość odcisku każdego bloku danych. Taki odcisk jest często zwany wartością skrótu.

Przed przesłaniem bloku danych do skarbca agent wysyła zapytanie do bazy danych deduplikacji, aby ustalić, czy wartość skrótu bloku jest taka sama jak jednego z bloków już przechowywanych. Jeśli tak, agent wysyła tylko wartość skrótu. W przeciwnym razie wysyła sam blok. Węzeł magazynowania zapisuje otrzymane bloki danych w pliku tymczasowym.

Niektórych danych, jak np. zaszyfrowanych plików lub bloków dysków o niestandardowym rozmiarze, nie można deduplikować. Agent zawsze wysyła takie dane do skarbca bez obliczania wartości skrótu. Aby uzyskać więcej informacji na temat ograniczeń deduplikacji, zobacz Ograniczenia deduplikacji.

Po ukończeniu procesu tworzenia kopii zapasowej skarbiec zawiera powstałą kopię zapasową oraz plik tymczasowy z unikatowymi blokami danych. Plik tymczasowy zostanie przetworzony na następnym etapie. Plik kopii zapasowej (plik TIB) zawiera wartości skrótów i dane, których nie można deduplikować. Dalsze przetwarzanie tej kopii zapasowej nie jest konieczne. Możesz łatwo odzyskać z niej dane.

Deduplikacja w miejscu docelowym

Gdy zakończy się tworzenie kopii zapasowej w skarbcu deduplikacji, węzeł magazynowania uruchomi czynność indeksowania. Czynność ta powoduje deduplikację danych w skarbcu w następującej kolejności:

  1. Przenosi bloki danych z pliku tymczasowego do specjalnego pliku wewnątrz skarbca, gdzie zapisuje zduplikowane elementy tylko raz. Plik ten nazywany jest magazynem danych deduplikacji.
  2. Zapisuje w bazie danych deduplikacji wartości skrótów i łącza niezbędne do „złożenia” danych po deduplikacji.
  3. Po przeniesieniu wszystkich bloków danych usuwa plik tymczasowy.

W rezultacie magazyn danych zawiera pewną liczbę unikatowych bloków danych. Każdy blok ma jedno lub kilka odwołań z kopii bezpieczeństwa. Odwołania są zawarte w bazie danych deduplikacji. Kopie bezpieczeństwa pozostają nienaruszone. Zawierają wartości skrótów oraz dane, których nie można deduplikować.

Poniższy diagram ilustruje rezultat deduplikacji w miejscu docelowym.

Wykonanie czynności indeksowania może zająć sporo czasu. Stan tego działania można sprawdzić na serwerze zarządzania, wybierając odpowiedni węzeł magazynowania i klikając Wyświetl szczegóły. W tym oknie można także uruchomić lub zatrzymać to działanie.

W przypadku tworzenia kopii zapasowej dużej ilości unikatowych danych działanie indeksowania może się nie powieść ze względu na zbyt małą pamięć RAM w węźle magazynowania. Operacje tworzenia kopii zapasowej będą kontynuowane. Możesz zwiększyć pamięć RAM węzła magazynowania lub usunąć zbędne kopie zapasowe i uruchomić kompaktowanie. Po utworzeniu następnej kopii zapasowej indeksowanie zostanie uruchomione ponownie.

Kompaktowanie

Gdy ze skarbca zostanie usunięta — ręcznie lub podczas czyszczenia — jedna lub więcej kopii zapasowych bądź archiwów, magazyn danych może zawierać bloki, do których nie odwołuje się żadne archiwum. Elementy takie są usuwane przez zadanie kompaktowania, które jest zaplanowanym zadaniem wykonywanym przez węzeł magazynowania.

Domyślnie zadanie kompaktowania jest uruchamiane w każdą niedzielę o godzinie 03:00. Można zmienić jego harmonogram, wybierając odpowiedni węzeł magazynowania, klikając Wyświetl szczegóły, a następnie Harmonogram kompaktowania. Na karcie tej można również ręcznie uruchomić lub zatrzymać to zadanie.

Ponieważ usuwanie nieużywanych bloków wymaga użycia dużej ilości zasobów, zadanie kompaktowania usuwa je tylko po zgromadzeniu wystarczającej ilości danych do usunięcia. Próg jest określony przez parametr konfiguracyjny Próg uruchomienia kompaktowania.