QSAN 部落格

是否套用資料縮減?資料管理策略系列 – 第二部

Apply-Data-Reduction-or-Not-Data-Management-Strategy-Series---Part-2

內容大綱

由於整體資源有限,無論是預算考量或是實體資源,儲存設備供應商都致力於提高資料儲存效率以解決資源不足的問題。另一方面,軟體定義的資料縮減策略也是解決困境的關鍵。

資料縮減是對原始資料容量縮減技術的一般描述。重複資料刪除和壓縮是幫助組織處理不斷增長的資料的最常見策略。因此,我們將研究這兩個功能並找出優點和可能的缺點。

壓縮

資料壓縮是一種為減小檔案或資料集大小的而設計資料儲存技術。透過以更有效率的方式對資訊進行編碼,壓縮可以最大限度地減少儲存資料所需的空間量,而不會犧牲其基本內容。

在企業中,壓縮被廣泛應用於各種應用程式中,以優化儲存、提高資料傳輸速度並提高整體儲存效率。備份和歸檔是壓縮的最佳應用場景。其他不經常存取的資料類型也適合壓縮,例如檔案共用或日誌檔案管理。

壓縮可能更常用於企業中不同類型的應用程式。儘管如此,仍存在一些限制壓縮效率的缺點。首先,壓縮效率與儲存廠商的演算法和機制密切相關。此外,還有一些資料類型限制了壓縮效能。例如,加密資料太複雜而無法壓縮。經常存取的資料也可能不適合壓縮策略。

重複資料刪除

重複資料刪除是一種資料縮減技術,旨在減少資料的冗餘副本。重複資料刪除不是儲存相同資料的多個實例,而是識別並消除重複的區塊,以便只保留一份副本。這可以顯著節省儲存空間,而不會影響資料完整性。

當您的資料儲存大量重複的冗餘資料時,通常會採用重複資料刪除。例如,虛擬化環境重複建立虛擬機。大多數情況下,IT (資訊科技) 團隊會建立大致相同的虛擬機,資料差異性僅在使用者資訊上有落差。在這種情況下,重複資料刪除可能是理想的解決方案。

儘管重複資料刪除技術有許多好處,但它也有一些限制。啟用重複資料刪除時,資料傳輸量首當其衝。客戶端存取資料時需要索引被刪除的冗餘資料。因此,需要強大的儲存媒體。其次,只有當整體資料有大量冗餘區塊時,重複資料刪除才能發揮應有的效率。在部署重複資料刪除時,使用傳統硬碟可能會因讀寫速度相對較慢而導致索引失敗。重複資料刪除過程涉及資料區塊的密集索引和比較,傳統硬碟可能難以滿足其效能需求,從而導致索引階段的延遲和故障風險。因此,儲存廠商傾向於採用全快閃陣列策略來滿足重複資料刪除技術的效能需求。

協助確定資料縮減使用的指南

儘管資料縮減應用有所限制,但大多數情況下採用資料縮減政策仍更具成本效益。根據 SNIA 的報告指出,「傳統硬碟:NVMe SSD」每 TB 的 TCO (總擁有成本) 價格比約為 45.37%。當應用資料縮減率達到 54.63% 或更高時,重複資料刪除策略將獲得比部署新儲存裝置更好的 TCO,如下圖所示。由於特定應用更適合重複資料刪除策略,因此可以實現更好的 TCO。此外,資料縮減策略可能會導致效能下降,但在儲存環境中部署 SSD (固態硬碟) 的仍可以獲得相較傳統硬碟有更好的效能表現。

TCO-per-TB-vs-Data-Reduction-Rate

我們的觀點

資料壓縮作為多功能儲存技術,可以最大限度地減少儲存資料所需的空間,而不影響其基本內容。它廣泛使用於各種企業應用,以優化儲存效率、提高資料傳輸速度並促進備份和歸檔應用。然而,其效率取決於儲存供應商的演算法,某些資料類型 (例如加密或頻繁存取的資料) 可能會對壓縮技術的效能構成挑戰。

重複資料刪除是一項擅長消除資料冗餘副本的技術,在資料重複普遍存在的場景 (例如虛擬化環境) 中脫穎而出,是一項有價值的策略。

在提供大量儲存容量節省和成本效率的同時,也存在效能權衡。因此,組織在設計儲存環境時必須在節省成本和可能的效能需求支出中找出平衡。

Official Blog

資料儲存管理的最新趨勢和觀點