Sprawdzone praktyki dotyczące deduplikacji

Deduplikacja to złożony proces zależny od wielu czynników.

Najważniejsze czynniki mające wpływ na szybkość deduplikacji to:

Aby zwiększyć wydajność deduplikacji, zastosuj poniższe zalecenia.

Umieść bazę danych deduplikacji i skarbiec deduplikacji na osobnych urządzeniach fizycznych

Aby zwiększyć szybkość dostępu do bazy danych deduplikacji, baza i skarbiec muszą znajdować się na osobnych urządzeniach fizycznych.

Najlepszą praktyką jest przydzielenie skarbcowi i bazie danych specjalnych urządzeń. Jeśli nie jest to możliwe, unikaj przynajmniej umieszczania skarbca lub bazy danych na wspólnym dysku z systemem operacyjnym. Jest to związane z dużą liczbą operacji odczytu/zapisu twardego dysku wykonywanych przez system operacyjny, co znacząco zwalnia deduplikację.

Wybór dysku bazy danych deduplikacji

S = (U / 2184) * 2

Znaczenie:

S — rozmiar dysku (w GB)

U — planowany rozmiar unikatowych danych w magazynie danych deduplikacji (w GB)

2 — odzwierciedla fakt, że na dysku musi być dwa razy więcej wolnego miejsca niż miejsca zajmowanego przez bazę danych

Jeśli na przykład planowany rozmiar unikatowych danych w magazynie danych deduplikacji wynosi U=5 TB, baza danych deduplikacji będzie wymagała co najmniej następującą ilość wolnego miejsca:

S = (5*1024 / 2184) * 2 = 4,7 GB

Wybór dysku skarbca deduplikacji

W celu zapobiegania utracie danych zaleca się użycie macierzy RAID 10, 5 lub 6. Macierz RAID 0 nie jest zalecana, ponieważ nie jest odporna na awarie. Macierz RAID 1 nie jest zalecana z powodu względnie niewielkiej prędkości. Do tego zastosowania nadają się zarówno dyski lokalne, jak i SAN.

128 MB pamięci RAM na 1 TB unikatowych danych

Nie trzeba go ściśle przestrzegać, jeśli nie występują problemy z wydajnością deduplikacji. Jeśli jednak deduplikacja przebiega zbyt wolno, dodanie większej ilości pamięci RAM w węźle magazynowania może znacząco podnieść prędkość deduplikacji.

Tylko jeden skarbiec deduplikacji na każdy węzeł magazynowania

Zdecydowanie zaleca się utworzenie w węźle magazynowania tylko jednego skarbca deduplikacji. W innym przypadku dostępna pamięć RAM zostanie proporcjonalnie rozdzielona między poszczególne skarbce.

64-bitowy system operacyjny

Węzeł magazynowania należy zainstalować w 64-bitowym systemie operacyjnym. Na komputerze z węzłem magazynowania nie powinny być uruchomione aplikacje o dużym zapotrzebowaniu na zasoby systemowe, takie jak systemy zarządzania bazami danych (DBMS) lub systemy planowania zasobów (ERP).

Procesor wielordzeniowy z zegarem co najmniej 2,5 GHz

Zaleca się użycie procesora o co najmniej 4 rdzeniach i częstotliwości zegara nie niższej niż 2,5 GHz.

Wystarczająca ilość wolnego miejsca w skarbcu

Indeksowanie kopii zapasowej wymaga tyle wolnego miejsca, ile zajmują dane kopii bezpośrednio po jej zapisaniu w skarbcu. Bez kompresji lub deduplikacji w miejscu źródłowym wartość ta jest równa rozmiarowi oryginalnych danych uwzględnionych w danej operacji tworzenia kopii zapasowej.

Szybka sieć lokalna

Zaleca się użycie sieci lokalnej 1 Gb. Pozwoli ona na równoległe wykonywanie 5-6 kopii zapasowych z deduplikacją bez wyraźnej redukcji szybkości.

Tworzenie kopii zapasowej typowego komputera przed utworzeniem kopii zapasowych kilku komputerów o podobnej zawartości

W przypadku tworzenia kopii zapasowych kilku komputerów o podobnej zawartości zaleca się najpierw utworzenie kopii zapasowej jednego komputera, a następnie odczekanie do zakończenia indeksowania danych uwzględnionych w kopii zapasowej. Po tym czasie tworzenie kopii zapasowych pozostałych komputerów będzie szybsze dzięki wydajnej deduplikacji. Z uwagi na zaindeksowanie kopii zapasowej pierwszego komputera większość danych znajduje się już w magazynie danych deduplikacji.

Tworzenie kopii zapasowych poszczególnych komputerów o różnych porach

Jeśli tworzysz kopie zapasowe dużej liczby komputerów, rozłóż w czasie operacje tworzenia kopii zapasowych. W tym celu utwórz kilka planów tworzenia kopii zapasowych z różnymi harmonogramami.

Korzystanie z katalogowania szybkiego

Indeksowanie kopii zapasowej zaczyna się po zakończeniu jej katalogowania. Aby skrócić łączny czas potrzebny na przetwarzanie kopii zapasowych, przełącz katalogowanie automatyczne na tryb katalogowania szybkiego. Katalogowanie pełne można rozpocząć ręcznie poza oknem na utworzenie kopii zapasowej.

Konfigurowanie powiadomień o alertach

Zaleca się skonfigurowanie powiadomienia o alercie „Skarbce” w opcjach serwera zarządzania. Ułatwi to szybką reakcję na niecodzienne sytuacje. Szybka reakcja na alert „Istnieje skarbiec z małą ilością wolnego miejsca” może na przykład zapobiec wystąpieniu błędu podczas późniejszej operacji tworzenia kopii zapasowej w skarbcu.