重複除外のしくみ

ソースでの重複除外

非重複化格納域へのバックアップを実行すると、Acronis Backup & Recovery 10 エージェントは、バックアップされている項目(ディスク バックアップではディスク ブロック、ファイル バックアップではファイル)を読み取り、各ブロックのフィンガープリントを計算します。 このフィンガープリントはハッシュ値とも呼ばれ、格納域内の項目の内容を一意に表します。

エージェントは格納域に項目を送信する前に、重複除外データベースに照会して、項目のハッシュ値がすでに格納されている項目のハッシュ値と同じかどうかを調べます。

同じである場合、エージェントは、項目のハッシュ値だけを送信します。同じでない場合、項目自体を送信します。

暗号化されたファイルや標準サイズ外のディスク ブロックなどの一部の項目は重複除外できないので、エージェントは常にハッシュ値を計算せずにこれらの項目を格納域に転送します。 ファイル レベルとディスク レベルの重複除外の制限の詳細については、「重複除外の制限」を参照してください。

ターゲットでの重複除外

重複除外格納域へのバックアップが完了した後、ストレージ ノードは、インデックス作成タスクを実行して、次のように格納域のデータを重複除外します。

  1. アーカイブから格納域内の専用ファイルに項目(ディスク ブロックまたはファイル)を移動し、重複した項目をそこに一度だけ保存します。 このファイルは重複除外データ ストアと呼ばれます。 格納域にディスク レベルとファイル レベルの両方のバックアップがある場合は、データ ストアは 2 つあります。 重複除外できない項目は、アーカイブ内に残されます。
  2. アーカイブ内では、移動された項目が、対応する参照に置き換えられます。

この結果、格納域には一意の重複除外された項目が多数含まれ、項目への 1 つまたは複数の参照が格納域のアーカイブから各項目に与えられます。

インデックス作成タスクは、完了するまでにかなりの時間を要することがあります。 このタスクの状態は、管理サーバーの [圧縮タスク] ビューで確認できます。

圧縮

クリーンアップにより、または手動で 1 つまたは複数のバックアップやアーカイブを格納域から削除した後、どのアーカイブからも参照されなくなった項目が格納域に残る場合があります。 このような項目は圧縮タスクで削除されます。これは、ストレージ ノードによって実行されるスケジュールされたタスクです。

デフォルトでは、圧縮タスクは毎週日曜日の夜 03:00 に実行されます。 「ストレージ ノードの操作」の「圧縮タスクのスケジュールの変更」の説明に従って、タスクのスケジュールを変更できます。 [タスク] ビューから、手動でタスクを開始または停止することもできます。

未使用の項目を削除する際はリソースが消費されるため、圧縮タスクは、削除するデータの量が十分に蓄積されたときにだけ実行されます。 しきい値は、Compacting Trigger Threshold 構成パラメータによって決定されます。