Optimale Vorgehensweisen bei der Deduplizierung

Deduplizierung ist ein komplexer Prozess, der von vielen Faktoren abhängt.

Die wichtigsten Faktoren, die die Deduplizierungsgeschwindigkeit beeinflussen, sind:

Folgen Sie den unteren Empfehlungen, um die Deduplizierungsperformance zu verbessern.

Legen Sie die Deduplizierungsdatenbank und das deduplizierende Depot auf separate physische Geräte

Um die Zugriffsgeschwindigkeit auf eine Deduplizierungsdatenbank verbessern zu können, müssen die Datenbank und das Depot auf separaten physischen Geräten liegen.

Es ist am besten, dem Depot und der Datenbank je eigene, nur dafür dedizierte Geräte zuzuweisen. Falls das nicht möglich ist, sollten Sie zumindest weder das Depot noch die Datenbank auf ein gemeinsames Laufwerk mit dem Betriebssystem legen. Der Grund ist, dass das Betriebssystem häufige Lese-/Schreib-Aktionen auf dem Laufwerk durchführt, was die Deduplizierung deutlich verlangsamen kann.

Ein Laufwerk für eine Deduplizierungsdatenbank auswählen

G = (E / 2184) * 2

Wobei:

G die Laufwerksgröße in GB ist,

E die geplante Menge an 'einmaligen' (nur einmal vorkommenden) Daten im Deduplizierungsdatenspeicher in GB ist.

Die Zahl 2 reflektiert den Umstand, dass das Laufwerk doppelt so viel freien Speicherplatz haben muss, wie die Datenbank belegt.

Falls beispielsweise für die geplante Menge der einmaligen Daten im Deduplizierungsdatenspeicher 'E=5 TB' gilt, dann erfordert die Deduplizierungsdatenbank einen freien Speicherplatz mit folgender Größe:

G = (5*1024 / 2184) * 2 = 4,7 GB

Ein Laufwerk für ein deduplizierendes Depot wählen

Zum Schutz gegen Datenverlust empfehlen wir die Verwendung von RAID 10, 5 oder 6. RAID 0 wird nicht empfohlen, da es nicht fehlertolerant ist. RAID 1 ist aufgrund seiner geringen Geschwindigkeit nicht empfehlenswert. Es gibt keine Bevorzugung von lokalen Laufwerken gegenüber SAN, beide sind gut.

128 MB an RAM pro 1 TB an einmaligen Daten

Sie müssen dieser Empfehlung nicht unbedingt folgen, solange Sie keine Performance-Probleme bei der Deduplizierung feststellen. Sollte die Deduplizierung jedoch zu langsam sein, dann können Sie die Deduplizierungsgeschwindigkeit möglicherweise deutlich anheben, wenn Sie dem Storage Node mehr Arbeitsspeicher (RAM) hinzufügen.

Nur ein deduplizierendes Depot auf jedem Storage Node

Es wird dringend empfohlen, nur ein deduplizierendes Depot auf einem Storage Node zu erstellen. Anderenfalls kann die gesamte Menge des RAMs proportional zur Anzahl der Depots unter diesen aufgeteilt werden.

64-Bit-Betriebssystem

Der Storage Node muss auf einem 64-Bit-Betriebssystem installiert werden. Auf der Maschine mit dem Storage Node sollten keine weiteren Anwendungen ausgeführt werden, die viele Systemressourcen erfordern, wie beispielsweise Datenbankverwaltungssysteme (DBMS) oder Enterprise Resource Planning-Systeme (ERP).

Ein Mehrkern-Prozessor mit einer Taktrate von mindestens 2,5 GHz

Wir empfehlen die Verwendung eines Prozessors mit wenigstens 4 Kernen und einer Taktfrequenz nicht unter 2,5 GHz.

Ausreichend freier Speicherplatz im Depot

Die Indizierung eines Backups erfordert genauso viel freien Speicherplatz, wie die Daten des Backups unmittelbar nach ihrer Sicherung zum Depot belegt haben. Ohne Komprimierung oder Deduplizierung an der Quelle entspricht dieser Wert der Größe der ursprünglich gesicherten Daten während einer gegebenen Backup-Aktion.

High-Speed LAN

1-Gbit-LAN wird empfohlen. Dadurch kann die Software 5-6 Backups mit Deduplizierung parallel durchführen, ohne dass die Geschwindigkeit deutlich heruntergeht.

Backup einer typischen Maschine, bevor Sie mehrere Maschinen mit ähnlichem Inhalt sichern

Wenn Sie mehrere Maschinen mit ähnlichem Inhalt sichern wollen, empfiehlt es sich, zuerst nur das Backup einer Maschine zu erstellen und dann zu warten, bis die Indizierung der gesicherten Daten abgeschlossen ist. Danach werden die Backups der anderen Maschinen schneller verlaufen, was der effizienten Deduplizierung zu verdanken ist. Da das Backup der ersten Maschine bereits indiziert wurde, befinden sich die meisten Daten bereits im Deduplizierungsdatenspeicher.

Backups von verschiedenen Maschinen zu unterschiedlichen Zeiten

Falls Sie eine größere Anzahl an Maschinen sichern wollen, sollten Sie die Backup-Aktionen zeitlich verteilen. Erstellen Sie dazu mehrere Backup-Pläne mit unterschiedlichen Planungen.

Schnelle Katalogisierung verwenden

Die Indizierung eines Backups startet, nachdem seine Katalogisierung abgeschlossen wurde. Um die zur Backup-Verarbeitung benötigte Gesamtzeit zu reduzieren, können Sie die automatische Katalogisierung in den schnellen Modus umschalten. Sie können die vollständige Katalogisierung auch manuell außerhalb des Backup-Fensters starten.

Alarmbenachrichtigungen konfigurieren

Es wird empfohlen, dass Sie in den Management Server-Optionen Alarmbenachrichtigungen für die Depots konfigurieren. Dadurch können Sie schneller bei Störungen oder Ausfällen reagieren. Eine rechtzeitige Reaktion auf eine Alarmmeldung vom Typ 'Es gibt ein Depot mit wenig freiem Speicherplatz' kann vor einem Fehler beim nächsten Backup zum Depot schützen.