Advies voor deduplicatie
Deduplicatie is een complex proces dat afhankelijk is van een groot aantal factoren.
De meest belangrijke factoren die van invloed zijn op de snelheid van de deduplicatie zijn:
- De toegangssnelheid tot de deduplicatiedatabase
- De RAM-capaciteit van het opslagknooppunt
- Het aantal deduplicatielocaties dat is gemaakt op het opslagknooppunt.
Verbeter de deduplicatieprestaties door de onderstaande aanbevelingen te volgen.
Plaats de deduplicatiedatabase en de deduplicatielocatie op aparte fysieke apparaten
De deduplicatiedatabase slaat de hashwaarden op van alle items die op de locatie zijn opgeslagen, behalve van items die niet kunnen worden gedupliceerd, zoals versleutelde bestanden.
De toegangssnelheid voor een deduplicatiedatabase kan worden verhoogd door de database en de locatie op afzonderlijke fysieke apparaten te plaatsen.
Het is het beste om specifiek voor dit doel bestemde apparaten toe te wijzen voor de locatie en de database. Als dit niet mogelijk is, moet u in ieder geval voorkomen dat een locatie of database op dezelfde schijf als het besturingssysteem wordt geplaatst. De reden hiervoor is dat het besturingssysteem een groot aantal lees-/schrijfbewerkingen uitvoert op de harde schijf, waardoor de snelheid van de deduplicatie aanzienlijk afneemt.
Een schijf selecteren voor een deduplicatiedatabase
- De database moet zich op een vast station bevinden. Probeer niet de deduplicatiedatabase op externe verwisselbare stations te plaatsen.
- Teneinde de toegangstijd tot de database tot een minimum te beperken, slaat u deze op een rechtstreeks aangesloten station op in plaats van op een gekoppeld netwerkvolume. De deduplicatieprestaties kunnen aanzienlijk verminderen ten gevolge van de netwerklatentie.
- De schijfruimte die is vereist voor een deduplicatiedatabase kan worden geschat op basis van de volgende formule:
S = U * 90 / 65536 + 10
Hier is
S de schijfgrootte, in GB
U de geplande hoeveelheid unieke gegevens in de opslag voor deduplicatie van gegevens, in GB
Als de geplande hoeveelheid unieke gegevens in de opslag voor deduplicatie van gegevens bijvoorbeeld U=5 TB bedraagt, dan is voor de deduplicatiedatabase de hieronder weergegeven minimale hoeveelheid vrije schijfruimte vereist:
S = 5000 * 90 / 65536 +10 = 17 GB
Een schijf selecteren voor een locatie voor deduplicatie
Ter voorkoming van gegevensverlies adviseren wij gebruik te maken van RAID 10, 5 of 6. RAID0 is wordt niet aanbevolen omdat hierbij geen fouttolerantie wordt geboden. RAID 1 is wordt niet aanbevolen vanwege de relatief lage snelheid. Er is geen sprake van voorkeur voor lokale schijf of SAN. Beide zijn goed.
40 tot 160 MB RAM per 1 TB unieke gegevens
Wanneer de limiet wordt bereikt, stopt de deduplicatie, maar back-up en herstel blijven functioneren. Als u meer RAM toevoegt aan het opslagknooppunt, wordt de deduplicatie weer hervat na de volgende back-up. In het algemeen geldt dat hoe meer RAM u hebt, hoe groter de volumes unieke gegevens zijn die u kunt opslaan.
Maak slechts één locatie voor deduplicatie per opslagknooppunt
Het wordt dringend aanbevolen slechts één locatie voor deduplicatie te maken op elk opslagknooppunt. Anders wordt mogelijk het hele beschikbare RAM-volume evenredig verdeeld over de verschillende locaties.
Geen strijd om resources door applicaties
Op de machine met het opslagknooppunt mogen geen applicaties worden uitgevoerd die veel systeembronnen vereisen, zoals DBMS- (Database Management Systems) of ERP-systemen (Enterprise Resource Planning).
Processor met meerdere kernen en een kloksnelheid van minimaal 2,5 GHz
Wij adviseren u een processor te gebruiken met niet minder dan vier kernen en een kloksnelheid van minimaal 2,5 GHz.
Voldoende vrije schijfruimte op de locatie
Deduplicatie op een doel vereist evenveel vrije schijfruimte als de gegevens van back-ups direct na opslag op de locatie. Zonder compressie of deduplicatie bij de bron is deze waarde gelijk aan de omvang van de oorspronkelijke gegevens waarvan een back-up wordt gemaakt tijdens de back-upbewerking in kwestie.
Zeer snel LAN
Een LAN van 1 Gbit wordt aanbevolen. Hierdoor kan de software parallel 5-6 back-ups met deduplicatie uitvoeren zonder dat de snelheid aanzienlijk afneemt.
Maak een back-up van een standaardmachine voordat u back-ups gaat uitvoeren van verschillende machines met vergelijkbare inhoud
Als u back-ups maakt van meerdere machines met vergelijkbare inhoud, wordt geadviseerd eerst een back-up te maken van één machine en vervolgens te wachten totdat de indexering van de gegevens waarvan een back-up wordt gemaakt is voltooid. Daarna verloopt het maken van een back-up van de andere machines sneller vanwege de efficiënte deduplicatie. Aangezien de back-up van de eerste machine is geïndexeerd, bevinden de meeste gegevens zich al in de gegevensopslag voor deduplicatie.
Maak op verschillende tijdstippen back-ups van verschillende machines
Als u een back-up maakt van een groot aantal machines, verdeelt u de back-upbewerkingen over een langer tijdsbestek. Hiertoe maakt u meerdere beschermingsschema's met verschillende planningen.