QSAN 部落格

中小型企業如何應用儲存技術實現 AI 目標

blog-best storage for AI-bannerjpg

內容大綱

中小型企業中的 AI 應用

AI(人工智慧)正在商業界掀起波濤。各種規模的企業都可以從 AI 中受益。因此,即使是 SMB(中小型企業),也能夠利用新興軟體工具和現代硬體平台的力量,建立內部資料倉庫或知識庫,實現自動化系統的應用。

AI 是機器模仿人類認知的能力。它可以被編程用以解決問題時模仿與感知、推理和學習相似的工作方式。例如,使用現有資源如常見問題解答和腳本化的回應來設置聊天機器人,以提供對人類用戶查詢最合適的回應,從而提升客戶服務。此外,AI 還可以幫助企業做出有關客戶真正需求的明智決策,以建立更好的行銷活動和客戶關係。

隨著轉向人工智慧轉型,將需要時間和金錢的投資。但中小型企業絕對有可能負擔得起,並利用現有的人工智慧技術。此外,現代硬體平台,包括針對中小型企業量身定制的儲存解決方案,在實惠的人工智慧解決方案中發揮著關鍵作用。

AI 儲存的運作原理

人工智慧、機器學習和深度學習需要儲存大量資料以進行後續處理。大數據確實有助於訓練模擬和模型,以提供決策信息,並提高洞察力的有效性和準確性。AI工作負載的資料儲存和計算需求與通用用途大不相同。這些應用程式依賴資料運行,需要高性能、可靠和可擴展的資料儲存解決方案。作為AI工作負載的一部分,這種儲存必須具備一些關鍵功能,以實現有效性。

  1. 可擴展性:AI 需要處理大量資料。因此,隨著收集到越來越多的 AI 資料,儲存必須能夠擴展到達到比 PB(百萬兆字節)甚至更多的容量。此外,用於 AI 工作負載的儲存必須能夠迅速響應這些需求,而不會阻礙它們。
  2. 快速存取:AI 建立在一個複雜的基礎架構之上。儲存、應用程式和資料收集設備可以分佈在不同的環境中。儘管效率至關重要,但快速的儲存不會導致 AI 操作的瓶頸。
  3. 延遲:I/O 延遲對於構建和使用 AI 模型非常重要,因為資料需要多次讀取和重讀。因此,減少 I/O 延遲可以將 AI 訓練時間縮短數天或數月。
  4. 吞吐量:訓練過程使用大量資料,通常以每小時的 TB(terabytes)數來衡量。因此,提供這個級別的隨機訪問資料對許多儲存系統來說可能具有挑戰性。
  5. 成本效益:AI 應用的範疇和規模多種多樣且動態變化。AI 的儲存應該具有靈活性,可以從小規模開始,但可以根據需求以具有成本效益的方式擴展,同時保持類似的性價比。同時,通過適當的儲存管理或可擴展性,避免購買和維護未使用的資源。

總之,有效的儲存、可擴展性和成本管理的結合是支撐 AI 應用的儲存基礎。

儲存 AI 的重點

為了 AI 的儲存,需要特定的系統配置,尤其是在優化硬體和資料傳輸基礎設施方面。儲存將成為一個由幾個關鍵組件組成的高性能計算環境的一部分。這些組件將包括以下內容:

  1. 高速連接:高帶寬的前端支援與 AI 和機器學習相關的大型工作負載。因此,通過 InfiniBand、Fibre Channel 或 iSCSI 進行適當配置的連接,以從快速儲存中提取資料,為大規模 AI 算法準備資料,對於構建先進的 AI 至關重要。儘管 InfiniBand 提供了最高的網絡性能,但它們需要專有設備,並且具有更高的採購成本。建議中小型企業首先使用已廣泛部署的 25 GbE / 10 GbE iSCSI 或 32 Gb / 16 Gb Fibre Channel,這些選擇成本更友好。
  2. 快閃儲存:對於如此龐大的工作負載,重要的是在硬體層面提供快速的儲存檢索。然而,靠近強大伺服器的儲存可以作為需要快速資料存取的 AI 應用的即時儲存媒體。
  3. 容量儲存:大量資料還可以包括長期儲存,超越快閃儲存,以節省成本。因此,快閃儲存負責快速計算,而容量儲存則保留長期資料。鑒於資料的快速增長,在未來,中小型企業領域的儲存容量保留至 10 PB 已經相對足夠。
  4. 性能閾值:從儲存到 AI 和機器學習算法的快速資料處理需要能夠處理大規模並行計算任務的硬體。隨機讀取和重讀的處理速度應該更高,而延遲應該更低。現代的中小型企業 SAN 儲存支援隨機讀取至少 500K IOPS,延遲低於 1 毫秒,提供了豐富的空間來容納各種 AI 應用。

談到 AI 儲存時,速度和容量是主要要考慮的因素。

塊儲存是最適合的選擇

總結以上內容,不同的儲存產品都有其優點和缺點。

  1. 區塊儲存:基於塊的儲存提供了最低的延遲和最大的 I/O 吞吐量,但在可擴展性方面有限。通過第三方的並行檔案系統,如 BeeGFS,它可以為具備現代 SAN 儲存的中小企業提供理想的 AI 解決方案,能夠以具有成本效益和高效空間利用率的方式擴展到 10 PB。
  2. 檔案儲存:基於檔案的儲存將資料保存為一個文件夾中的單一信息,以便與其他資料進行組織。但從歷史上看,基於檔案的產品並未提供最高水平的性能。
  3. 物件儲存:基於物件的儲存將每個資料項分配為一個物件,並結合相關的後設資料來形成一個儲存池。它提供了最高的可擴展性,但通常並不提供最佳的吞吐量或最低的延遲。
blog-table of latency in different storage types

考慮到各種權衡,中小企業中 AI 的目標是以最低成本實現最大速度。全快閃陣列(AFAs)無疑是理想的儲存解決方案。再加上常用的協議,如 25 GbE / 10 GbE iSCSI 或 32 Gb / 16 Gb Fibre Channel,可以直接連接多台伺服器,進一步降低成本,而無需部署昂貴和複雜的網絡設備。開源並行檔案系統,如 BeeGFS,也對中小企業輕松採用 AI 起到了很大作用。

建構區塊儲存範例

以下是中小型企業的建構區塊範例。對於當前的專案,使用全快閃陣列中的活動資料集進行訓練過程。然後,將結果和資料集移至成本較低的容量儲存中以進行長期保留。

blog-Building Block Example1

舉個成本優化的例子。對於中小型企業中的 AI,混合儲存而不是全快閃陣列和容量儲存是一種具有成本效益的選擇,因為它結合了高性能 SSD 和最佳價格容量比 HDD。在快閃儲存池中處理當前的資料集,並在專案完成時將其移至容量儲存池。如果平台和磁盤驅動器匹配得當,性能也是可以接受的。

blog-Building Block Example2

我們的觀點

使用或訓練 AI 的應用程式無法依賴傳統的儲存來正常運作。這些應用需要高性能、高可用性的儲存,可以持續地輸入大量資料以促進學習和增長。根據上面的分析和建議,區塊儲存對於中小型企業中的 AI 是合適的,無論是使用 AFA 加 SAN 儲存還是結合兩者的混合塊儲存。搭配 BeeGFS,這是一個為高性能計算而開發和優化的流行並行檔案系統,可以形成具競爭力的 AI 訓練環境。

Official Blog

資料儲存管理的最新趨勢和觀點