重複除外のベスト プラクティス

重複除外は、多くの要因に左右される複雑なプロセスです。

重複除外の処理速度に影響を及ぼす最も重要な要因は、次のとおりです。

重複除外のパフォーマンスを高めるには、推奨事項に従う必要があります。

重複除外データベースと非重複化された格納域を別の物理デバイスに配置する

重複除外データベースへのアクセス速度を高めるには、データベースと格納域を別の物理デバイスに配置する必要があります。

格納域とデータベースに専用デバイスを割り当てる方法が最適です。この方法が不可能である場合は、少なくとも、オペレーティング システムがある同じディスクに格納域またはデータベースを配置しないでください。この配慮が必要な理由は、オペレーティング システムはハード ディスクでの読み取り/書き込みを多く実行するからです。これらの処理が実行されると、重複除外の実行速度が大幅に低下します。

重複除外データベースのディスクを選択する

S = U / 32 + 10

ここで、

S: ディスク サイズ(単位は GB)

U: 重複除外データ ストアに保存される重複のないデータの予測容量(単位は GB)

たとえば、重複除外データ ストアに保存される重複のないデータの予測容量が U=5 TB である場合、重複除外データベースで必要とされる空きディスク領域は、以下の式の結果より小さい値にはなりません。

S = 5*1024 / 32 + 10 = 170 GB

非重複化された格納域のディスクを選択する

データの消失を防ぐために、RAID 10、5、または 6 の利用をお勧めします。障害耐性がないため、RAID 0 は推奨されません。転送速度が比較的遅いため、RAID 1 は推奨されません。ローカル ディスクまたは SAN は利用可能ですが、最適ではありません。

3 GB の RAM(重複のないデータ 1 TB あたり)

重複除外のパフォーマンスに問題がない場合は、この推奨に従う必要はありません。ただし、重複除外があまりにも遅い場合、RAM をストレージ ノードに追加することで重複除外の実行速度を大幅に改善できます。

通常、重複除外の実行速度が同じである場合、RAM が多くなるほど、重複除外データベースのサイズも大きく拡張できます。

各ストレージ ノードでは非重複化された格納域を 1 つに制限する

ストレージ ノードでは、作成する非重複化された格納域を 1 つのみにすることを強く推奨します。複数作成すると、利用可能な RAM の全容量が、格納域の数に応じて分散できます。

64 ビット オペレーティング システム

ストレージ ノードは、64 ビット オペレーティング システムにインストールする必要があります。Database Management Systems(DBMS)や Enterprise Resource Planning(ERP)システムなど、システム リソースを多く必要とするアプリケーションは、ストレージ ノードのコンピュータで実行しないようにします。

最低 2.5 GHz のクロック レートを発揮するマルチコア プロセッサ

最低 4 コアで構成され、最低 2.5 GHz のクロック レートを発揮するプロセッサを使用することを推奨します。

格納域の十分な空き領域

バックアップのインデックス付けには、格納域に保存された直後に、バックアップ データに使用される領域と同程度の容量が必要になります。ソースで圧縮または重複除外を行っていない場合、この値は特定のバックアップ操作でバックアップされた元のデータと同じサイズになります。

高速 LAN

1 Gbit LAN を推奨します。この LAN では、重複除外により 5~6 のバックアップ操作を並行して実行できます。この際、実行速度が大幅に低下することはありません。

データの内容が類似している複数のコンピュータをバックアップする前に、代表的な 1 台のコンピュータをバックアップする

内容が類似している複数のコンピュータをバックアップするときは、1 台のコンピュータを最初にバックアップし、バックアップされたデータのインデックス付けが完了するまで待つことをお勧めします。インデックス付けの実行後、効率的な重複除外により、他のコンピュータはより迅速にバックアップされます。最初のコンピュータのバックアップに対してインデックス付けが実行されているため、多くのデータが既に重複除外データ ストアに含まれています。

異なるコンピュータを異なる時間帯にバックアップする

多くのコンピュータをバックアップする場合は、時間をずらしてバックアップ操作を展開していきます。時間をずらすことで、さまざまなスケジュールで複数のバックアップ計画を作成します。

高速カタログ化の使用

カタログ化が完了した後で、バックアップのインデックス付けが開始されます。バックアップ処理に必要な時間を全体的に削減するには、自動カタログ作成を高速モードに切り替えます。バックアップ ウィンドウの外部では、完全なカタログ化を手動で開始できます。

アラートの通知の設定

管理サーバー オプションで「格納域」のアラート通知を設定することをお勧めします。この設定により、混乱した状況でも即座に対応できるようになります。たとえば、「空き領域が少なくなっている格納域があります」アラートに適切なタイミングで対応することで、次回、格納域にバックアップするときにエラーを防止できます。