Deduplikacja to złożony proces zależny od wielu czynników.
Najważniejsze czynniki mające wpływ na szybkość deduplikacji to:
Aby zwiększyć wydajność deduplikacji, zastosuj poniższe zalecenia.
Umieść bazę danych deduplikacji i skarbiec deduplikacji na osobnych urządzeniach fizycznych
Aby zwiększyć szybkość dostępu do bazy danych deduplikacji, baza i skarbiec muszą znajdować się na osobnych urządzeniach fizycznych.
Najlepszą praktyką jest przydzielenie skarbcowi i bazie danych specjalnych urządzeń. Jeśli nie jest to możliwe, unikaj przynajmniej umieszczania skarbca lub bazy danych na wspólnym dysku z systemem operacyjnym. Jest to związane z dużą liczbą operacji odczytu/zapisu twardego dysku wykonywanych przez system operacyjny, co znacząco zwalnia deduplikację.
Wybór dysku bazy danych deduplikacji
S = (U / 2184) * 2
Znaczenie:
S — rozmiar dysku (w GB)
U — planowany rozmiar unikatowych danych w magazynie danych deduplikacji (w GB)
2 — odzwierciedla fakt, że na dysku musi być dwa razy więcej wolnego miejsca niż miejsca zajmowanego przez bazę danych
Jeśli na przykład planowany rozmiar unikatowych danych w magazynie danych deduplikacji wynosi U=5 TB, baza danych deduplikacji będzie wymagała co najmniej następującą ilość wolnego miejsca:
S = (5*1024 / 2184) * 2 = 4,7 GB
Wybór dysku skarbca deduplikacji
W celu zapobiegania utracie danych zaleca się użycie macierzy RAID 10, 5 lub 6. Macierz RAID 0 nie jest zalecana, ponieważ nie jest odporna na awarie. Macierz RAID 1 nie jest zalecana z powodu względnie niewielkiej prędkości. Do tego zastosowania nadają się zarówno dyski lokalne, jak i SAN.
128 MB pamięci RAM na 1 TB unikatowych danych
Nie trzeba go ściśle przestrzegać, jeśli nie występują problemy z wydajnością deduplikacji. Jeśli jednak deduplikacja przebiega zbyt wolno, dodanie większej ilości pamięci RAM w węźle magazynowania może znacząco podnieść prędkość deduplikacji.
Tylko jeden skarbiec deduplikacji na każdy węzeł magazynowania
Zdecydowanie zaleca się utworzenie w węźle magazynowania tylko jednego skarbca deduplikacji. W innym przypadku dostępna pamięć RAM zostanie proporcjonalnie rozdzielona między poszczególne skarbce.
64-bitowy system operacyjny
Węzeł magazynowania należy zainstalować w 64-bitowym systemie operacyjnym. Na komputerze z węzłem magazynowania nie powinny być uruchomione aplikacje o dużym zapotrzebowaniu na zasoby systemowe, takie jak systemy zarządzania bazami danych (DBMS) lub systemy planowania zasobów (ERP).
Procesor wielordzeniowy z zegarem co najmniej 2,5 GHz
Zaleca się użycie procesora o co najmniej 4 rdzeniach i częstotliwości zegara nie niższej niż 2,5 GHz.
Wystarczająca ilość wolnego miejsca w skarbcu
Indeksowanie kopii zapasowej wymaga tyle wolnego miejsca, ile zajmują dane kopii bezpośrednio po jej zapisaniu w skarbcu. Bez kompresji lub deduplikacji w miejscu źródłowym wartość ta jest równa rozmiarowi oryginalnych danych uwzględnionych w danej operacji tworzenia kopii zapasowej.
Szybka sieć lokalna
Zaleca się użycie sieci lokalnej 1 Gb. Pozwoli ona na równoległe wykonywanie 5-6 kopii zapasowych z deduplikacją bez wyraźnej redukcji szybkości.
Tworzenie kopii zapasowej typowego komputera przed utworzeniem kopii zapasowych kilku komputerów o podobnej zawartości
W przypadku tworzenia kopii zapasowych kilku komputerów o podobnej zawartości zaleca się najpierw utworzenie kopii zapasowej jednego komputera, a następnie odczekanie do zakończenia indeksowania danych uwzględnionych w kopii zapasowej. Po tym czasie tworzenie kopii zapasowych pozostałych komputerów będzie szybsze dzięki wydajnej deduplikacji. Z uwagi na zaindeksowanie kopii zapasowej pierwszego komputera większość danych znajduje się już w magazynie danych deduplikacji.
Tworzenie kopii zapasowych poszczególnych komputerów o różnych porach
Jeśli tworzysz kopie zapasowe dużej liczby komputerów, rozłóż w czasie operacje tworzenia kopii zapasowych. W tym celu utwórz kilka planów tworzenia kopii zapasowych z różnymi harmonogramami.
Korzystanie z katalogowania szybkiego
Indeksowanie kopii zapasowej zaczyna się po zakończeniu jej katalogowania. Aby skrócić łączny czas potrzebny na przetwarzanie kopii zapasowych, przełącz katalogowanie automatyczne na tryb katalogowania szybkiego. Katalogowanie pełne można rozpocząć ręcznie poza oknem na utworzenie kopii zapasowej.
Konfigurowanie powiadomień o alertach
Zaleca się skonfigurowanie powiadomienia o alercie „Skarbce” w opcjach serwera zarządzania. Ułatwi to szybką reakcję na niecodzienne sytuacje. Szybka reakcja na alert „Istnieje skarbiec z małą ilością wolnego miejsca” może na przykład zapobiec wystąpieniu błędu podczas późniejszej operacji tworzenia kopii zapasowej w skarbcu.