La deduplicazione è una procedura complessa che dipende da molti fattori.
I fattori più importanti che influenzano la velocità di deduplicazione sono:
Per aumentare le prestazioni della deduplicazione, seguire le raccomandazioni di seguito.
Posizionare il database di deduplicazione e il deposito di deduplicazione su periferiche fisiche separate
Per aumentare la velocità di accesso a un database di deduplicazione, il database e il deposito devono essere posizionati su periferiche fisiche separate.
È meglio allocare periferiche dedicate al deposito e al database. Se non è possibile, almeno non posizionare un deposito o un database sullo stesso disco del sistema operativo. Il motivo è che il sistema operativo esegue un elevato numero di operazioni di lettura/scrittura dei dischi rigidi, rallentando notevolmente la deduplicazione.
Selezione di un disco per un database di deduplicazione
D = (U / 2184) * 2
In questa formula,
D indica le dimensioni del disco, espresse in GB
U indica la quantità prevista di dati univoci nell'archivio di dati di deduplicazione, espressa in GB.
2 riflette il fatto che il disco deve disporre di spazio libero in quantità pari al doppio dello spazio occupato dal database.
Ad esempio, se la quantità prevista di dati univoci nell'archivio di dati di deduplicazione è U=5 TB, il database di deduplicazione richiederà una quantità minima di spazio disponibile su disco, come mostrato qui di seguito:
D = (5*1024 / 2184) * 2 = 4,7 GB
Selezione di un disco per un deposito di deduplicazione
Per prevenire la perdita dei dati, si consiglia l'utilizzo del RAID 10, 5 o 6. Il RAID 0 non è consigliato, poiché non è a tolleranza d'errore. Il RAID 1 non è consigliato a causa della velocità relativamente bassa. Non esistono preferenze in relazione alla scelta tra dischi locali e SAN, entrambe le opzioni sono adatte.
128 MB di RAM per 1 TB di dati univoci
Non è necessario seguire questa indicazione se non si presentano problemi con le prestazioni della deduplicazione. Tuttavia, se la deduplicazione è troppo lenta, l'aggiunta di ulteriore RAM al nodo di archiviazione può accrescere in maniera significativa la velocità di deduplicazione.
Solo un deposito di deduplicazione su ciascun nodo di archiviazione
Si consiglia fortemente di creare solo un deposito di deduplicazione su un nodo di archiviazione. In caso contrario, l'intero volume della RAM disponibile potrà essere distribuito in proporzione al numero dei depositi.
Sistema operativo a 64 bit
Il nodo di archiviazione deve essere installato in un sistema operativo a 64 bit. La macchina contenente il nodo di archiviazione non deve eseguire applicazioni che richiedono molte risorse di sistema; per esempio, i sistemi Database Management Systems (DBMS) o Enterprise Resource Planning (ERP).
Processore multi-core con frequenza di clock di almeno 2,5 GHz
Si consiglia di utilizzare un processore con numero di core non inferiore a 4 e frequenza di clock non inferiore a 2,5 GHz.
Spazio disponibile nel deposito sufficiente
L'indicizzazione di un backup richiede una quantità di spazio disponibile pari a quella occupata dai dati del backup subito dopo il loro salvataggio nel deposito. Senza la compressione o la deduplicazione all'origine, questo valore è uguale alle dimensioni dei dati originali del backup durante l'operazione di backup in questione.
LAN ad alta velocità
Consigliata LAN a 1 Gbit. Consentirà al software di eseguire 5-6 backup con deduplicazione in parallelo e la velocità non diminuirà considerevolmente.
Backup di una macchina tipica prima di eseguire il backup di molte macchine con contenuto simile
Quando si esegue il backup di molte macchine con contenuto simile, si consiglia di eseguire prima il backup di una macchina e di attendere il termine dell'indicizzazione dei dati del backup. Successivamente, il backup delle altre macchine verrà eseguito più rapidamente grazie all'efficienza della deduplicazione. Poiché il backup della prima macchina è stato indicizzato, la maggior parte dei dati si trova già nell'archivio di dati di deduplicazione.
Backup di macchine diverse in momenti diversi
Se si esegue il backup di un gran numero di macchine, distribuire le operazioni nel corso del tempo. Per eseguire questa operazione, creare molti piani di backup con pianificazioni diverse.
Utilizzo della catalogazione rapida
L'indicizzazione di un backup inizia al termine della sua catalogazione. Per ridurre il tempo totale necessario per l'elaborazione del backup, passare dalla catalogazione automatica alla modalità rapida. È possibile avviare manualmente la catalogazione completa all'esterno della finestra di backup.
Configurazione delle notifiche degli avvisi
Si consiglia di configurare le notifiche degli avvisi dei "Depositi" nelle opzioni del server di gestione. Questo può aiutare a reagire prontamente a situazioni di anomalie. Per esempio, una reazione tempestiva a un avviso "Deposito con spazio disponibile scarso" può aiutare a prevenire un errore al backup successivo nel deposito.