重複資料刪除最佳作法

重複資料刪除是一項取決於許多因素的複雜程序。

以下為影響重複資料刪除速度的最重要因素:

若要提高重複資料刪除效能,請參考以下建議。

將重複資料刪除資料庫和重複資料刪除儲藏庫放在不同的實體裝置上

若要提高重複資料刪除資料庫的存取速度,資料庫和儲藏庫必須位於不同的實體裝置上。

最佳作法是分別為儲藏庫和資料庫配置專用的裝置。如果無法這麼做,至少避免將儲藏庫或資料庫放在與作業系統相同的磁碟上。原因在於,作業系統會執行大量硬碟讀寫作業,這會大幅減慢重複資料刪除速度。

選擇重複資料刪除資料庫的磁碟

S = U / 64 + 10

其中:

S – 磁碟空間 (GB)

U – 重複資料刪除資料儲存區中預計會存放的唯一資料量 (GB)。

例如,如果重複資料刪除資料儲存區中預計會存放 U=5 TB 的唯一資料量,則重複資料刪除資料庫需要的可用磁碟空間至少為

S = 5*1024 / 64 + 10 = 90 GB

選擇重複資料刪除儲藏庫的磁碟

為避免資料喪失,建議使用 RAID 10、5 或 6。不建議使用 RAID 0,因為此配置無法容錯。不建議使用 RAID 1,因其速度較慢。本機磁碟或 SAN,兩者均可使用。

8 GB 的 RAM 應配置給每 1 TB 的唯一資料

此為適用於最糟情況的建議。如果您並未遭遇重複資料刪除的效能問題,便不一定需要遵循此建議。然而,如果重複資料刪除執行速度過慢,請查看重複資料刪除儲藏庫的 [佔用空間] 參數。增加更多 RAM 至儲存節點,可大幅提升重複資料刪除速度。

一般而言,假定重複資料刪除的速度相同,RAM 越多,重複資料刪除資料庫的大小就可以越大。

每個儲存節點上只配置一個重複資料刪除儲藏庫

強烈建議您在一個儲存節點上僅建立一個重複資料刪除儲藏庫。否則,所有可用的 RAM 將會按照儲藏庫的數量等比例分配。

64 位元作業系統

為了獲得最佳的重複資料刪除效能,請將儲存節點安裝在 64 位元作業系統上。電腦不應執行需要太多系統資源的應用程式,例如,資料庫管理系統 (DBMS) 或企業資源規劃 (ERP) 系統。

多核心處理器,具備至少 2.5 GHz 的時脈

建議您使用至少 4 核心、時脈至少 2.5 GHz 的處理器。

儲藏庫中有足夠的可用空間

儲存至儲藏庫後,備份索引所需的可用空間,和備份資料佔用的空間一樣大。若不在來源端進行壓縮或重複資料刪除,這個數值會等於在備份作業期間備份的原始資料大小。

高速 LAN

建議使用 1-Gbit 的 LAN。這可讓軟體同時執行 5-6 個含重複資料刪除的備份作業,且速度不會大幅減慢。

備份多部內容相似的電腦之前,先備份一部具有代表性的電腦

備份內容相似的多部電腦之前,建議您先備份一部電腦,並等候備份資料編列索引完畢。之後,由於重複資料刪除的效率提高,因此其他電腦的備份速度便可加快。由於第一部電腦的備份已編列索引,因此大多數資料已進入重複資料刪除資料儲存區。

在不同時間備份不同的電腦

如果您備份大量電腦,請將備份作業分散到不同的時間執行。方法是建立多個不同排程的備份計劃。

設定警示通知

建議您在管理伺服器選項中設定「儲藏庫」的警示通知。這有助於您在特殊情況發生時立即反應。例如,出現 [有儲藏庫的可用空間不足] 警示時,若能即時做出反應,可避免下一次備份至儲藏庫時發生錯誤。