Best practice per la deduplicazione

La deduplicazione è una procedura complessa che dipende da molti fattori.

I fattori più importanti che influenzano la velocità di deduplicazione sono:

Per aumentare le prestazioni della deduplicazione, seguire le raccomandazioni di seguito.

Posizionare il database di deduplicazione e il deposito di deduplicazione su periferiche fisiche separate

Per aumentare la velocità di accesso a un database di deduplicazione, il database e il deposito devono essere posizionati su periferiche fisiche separate.

È meglio allocare periferiche dedicate al deposito e al database. Se non è possibile, almeno non posizionare un deposito o un database sullo stesso disco del sistema operativo. Il motivo è che il sistema operativo esegue un elevato numero di operazioni di lettura/scrittura dei dischi rigidi, rallentando notevolmente la deduplicazione.

Selezione di un disco per un database di deduplicazione

D = U / 32 + 10

dove

D: dimensioni del disco, in GB

U: quantità prevista di dati univoci nell'archivio dei dati di deduplicazione, in GB.

Per esempio, se la quantità prevista di dati unici nell'archivio dei dati di deduplicazione è U=5 TB, il database di deduplicazione richiederà che lo spazio disponibile del disco non sia inferiore a

D = 5*1024 / 32 + 10 = 170 GB

Selezione di un disco per un deposito di deduplicazione

Per prevenire la perdita dei dati, si consiglia l'utilizzo del RAID 10, 5 o 6. Il RAID 0 non è consigliato, poiché non è a tolleranza d'errore. Il RAID 1 non è consigliato a causa della velocità relativamente bassa. Non esistono preferenze in relazione alla scelta tra dischi locali e SAN, entrambe le opzioni sono adatte.

3 GB di RAM per 1 TB di dati univoci

Non è necessario seguire questa indicazione se non si presentano problemi con le prestazioni della deduplicazione. Tuttavia, se la deduplicazione è troppo lenta, l'aggiunta di ulteriore RAM al nodo di archiviazione può accrescere in maniera significativa la velocità di deduplicazione.

In generale, più è la RAM disponibile, maggiori possono essere le dimensioni del database di deduplicazione, ammesso che la velocità della deduplicazione sia la stessa.

Solo un deposito di deduplicazione su ciascun nodo di archiviazione

Si consiglia fortemente di creare solo un deposito di deduplicazione su un nodo di archiviazione. In caso contrario, l'intero volume della RAM disponibile potrà essere distribuito in proporzione al numero dei depositi.

Sistema operativo a 64 bit

Il nodo di archiviazione deve essere installato in un sistema operativo a 64 bit. La macchina contenente il nodo di archiviazione non deve eseguire applicazioni che richiedono molte risorse di sistema; per esempio, i sistemi Database Management Systems (DBMS) o Enterprise Resource Planning (ERP).

Processore multi-core con frequenza di clock di almeno 2,5 GHz

Si consiglia di utilizzare un processore con numero di core non inferiore a 4 e frequenza di clock non inferiore a 2,5 GHz.

Spazio disponibile nel deposito sufficiente

L'indicizzazione di un backup richiede una quantità di spazio disponibile pari a quella occupata dai dati del backup subito dopo il loro salvataggio nel deposito. Senza la compressione o la deduplicazione all'origine, questo valore è uguale alle dimensioni dei dati originali del backup durante l'operazione di backup in questione.

LAN ad alta velocità

Consigliata LAN a 1 Gbit. Consentirà al software di eseguire 5-6 backup con deduplicazione in parallelo e la velocità non diminuirà considerevolmente.

Backup di una macchina tipica prima di eseguire il backup di molte macchine con contenuto simile

Quando si esegue il backup di molte macchine con contenuto simile, si consiglia di eseguire prima il backup di una macchina e di attendere il termine dell'indicizzazione dei dati del backup. Successivamente, il backup delle altre macchine verrà eseguito più rapidamente grazie all'efficienza della deduplicazione. Poiché il backup della prima macchina è stato indicizzato, la maggior parte dei dati si trova già nell'archivio dei dati di deduplicazione.

Backup di macchine diverse in momenti diversi

Se si esegue il backup di un gran numero di macchine, distribuire le operazioni nel corso del tempo. Per eseguire questa operazione, creare molti piani di backup con pianificazioni diverse.

Utilizzo della catalogazione rapida

L'indicizzazione di un backup inizia al termine della sua catalogazione. Per ridurre il tempo totale necessario per l'elaborazione del backup, passare dalla catalogazione automatica alla modalità rapida. È possibile avviare manualmente la catalogazione completa all'esterno della finestra di backup.

Configurazione delle notifiche degli avvisi

Si consiglia di configurare le notifiche degli avvisi dei "Depositi" nelle opzioni del server di gestione. Questo può aiutare a reagire prontamente a situazioni di anomalie. Per esempio, una reazione tempestiva a un avviso "Deposito con spazio disponibile scarso" può aiutare a prevenire un errore al backup successivo nel deposito.