重複除外のしくみ

ソースでの重複除外

重複除外された格納域へのバックアップを実行すると、Acronis Backup エージェントは各データ ブロックのフィンガープリントを計算します。フィンガープリントは、しばしばハッシュ値と呼ばれます。

エージェントは格納域にデータ ブロックを送る前に、重複除外データベースに照会して、そのブロックのハッシュ値が既に格納されているブロックのハッシュ値と同じかどうかを調べます。一致する場合はハッシュ値のみが送られ、一致しない場合はブロック自体が送られます。ストレージ ノードは、受け取ったデータ ブロックを一時ファイルに保存します。

暗号化ファイルや標準サイズではないディスク ブロックなど、一部のデータは重複除外できません。そのようなデータは、ハッシュ値を計算しないで格納域に転送されます。重複除外の制限の詳細については、「重複除外の制限」をご参照ください。

バックアップ処理が完了すると、格納域にはその結果として作成されたバックアップと、一意のデータ ブロックを含む一時ファイルが保存されます。一時ファイルは、次の段階で処理されます。バックアップ(TIB ファイル)には、ハッシュ値と重複除外できないデータが保存されます。このバックアップに対するこれ以上の処理は必要ありません。いつでもこのバックアップからデータを復元できます。

ターゲットでの重複除外

重複除外する格納域へのバックアップが完了すると、ストレージ ノードによって、インデックス作成アクティビティが実行されます。このアクティビティによって、次のように格納域内のデータが重複除外されます。

  1. 一時ファイルから格納域内の専用ファイルにデータ ブロックを移動し、重複した項目をそこに一度だけ保存します。このファイルは重複除外データストアと呼ばれます。
  2. 重複除外データを「構築」するために必要なハッシュ値およびリンクが重複除外データベースに保存されます。
  3. すべてのデータ ブロックが移動されると、一時ファイルは削除されます。

その結果、データストアには一意のデータブロックが大量に格納されます。それぞれのブロックは、1 つ以上のバックアップが参照します。その参照は、重複除外データベースに格納されます。バックアップは一切変更されません。バックアップには、ハッシュ値と重複除外できないデータが保存されます。

次の図に、ターゲットでの重複除外の結果を示します。

インデックス作成アクティビティは、完了するまでにかなりの時間を要することがあります。管理サーバーからこのアクティビティの状態を確認するには、対応するストレージ ノードを選択して、[詳細の表示] をクリックします。そのウィンドウでは、手動でこのアクティビティを開始または終了することができます。

大量の一意のデータをバックアップする場合は、ストレージ ノードの RAM が不十分なため、インデックス付け処理が失敗する可能性があります。バックアップは実行し続けます。ストレージ ノードの RAM を拡張するか、不要なバックアップを削除して、圧縮を実行できます。次回のバックアップの後、インデックス付けが再実行されます。

圧縮

手動またはクリーンアップで、1 つ以上のバックアップやアーカイブを格納域から削除した後、どのアーカイブからも参照されなくなったブロックがデータストアに残る場合があります。このようなブロックは圧縮タスクで削除されます。これは、ストレージ ノードによって実行される、スケジュールされたタスクです。

デフォルトでは、圧縮タスクは毎週日曜日の深夜 03:00 に実行されます。このタスクのスケジュールを変更するには、対応するストレージ ノードを選択して [詳細の表示] をクリックし、[圧縮スケジュール] をクリックします。このタブから、手動でタスクを開始または停止することもできます。

未使用のブロックを削除する際はリソースが消費されるため、圧縮タスクは、削除するデータの量が十分に蓄積されたときにだけ実行されます。しきい値は、[圧縮トリガしきい値] 設定パラメータによって決定されます。