如今,專家、學者都在呼吁要像重視智算中心或者算力中心一樣,重視存力中心的建設,但什么是存力中心?存力中心應該具備哪些衡量指標?對此,并沒有一個業(yè)內的共識,很多時候,會與存儲數據中心混為一談。為此,中國電子工業(yè)標準化技術協(xié)會數據存儲專委會(簡稱:數據存儲專委會)特邀業(yè)內專家進行研討和交流,并通過《數存連線》欄目對外傳播。

我非常榮幸受邀,與華為數據存儲產業(yè)發(fā)展總監(jiān)翟爽、中國移動研究院項目經理閆晗、數據存儲專委會秘書長孫鋼等專家參與第1期沙龍研討,也因此迸發(fā)了“有存,有力,才是存力中心”的觀點。

存力中心不能僅用存儲容量考評

在我看來“有存”非常好理解,數據要存下來,保護好,基本等同于存儲數據中心,數據在這里保存、使用,甚至交易。

相比“有力”應該怎么理解呢?對此,不妨對比一下算力,所謂算力可通過1PFLOPS(千萬億次/秒)或者10PFLOPS等GPU算力的指標進行衡量;那么,存力中心如果也用100PB/1EB數據存儲的能力進行界定是否可以呢?我認為千萬不可以!

為什么存力中心不可以照方抓藥呢?

之所以可以用1PFLOPS或者10PFLOPS等算力指標界定智算中心,是因為算力基本決定了AI大模型訓練、推理的能力和水平;相比,100PB/1EB存儲數據容量,只能夠代表數據的多與少,并不代表就此可以釋放數據的價值。借用數學的邏輯表述,存儲數據的能力是必要條件,卻并不是釋放數據價值的充要條件。

從數據到數據價值釋放,缺少了數據要素這個中間環(huán)節(jié)。

數據要素是存力中心非常重要的核心內容。這從數據要素的表述就可以體現出來,數據要素是指從數據中提煉出的、可用于生產經營并創(chuàng)造價值的資源,是數字經濟時代的核心生產要素之一。

應該說,數據要素才是存力中心建設的靈魂,也是“存力”的力量源泉。

存力如何進行衡量?

從數據到數據要素,再到數據價值的釋放,離不開生產力工具的使用,其中包括大數據以及AI大模型。AI大模型的使用已得到了廣泛的認可和重視,數據要素也不可避免地與AI大模型技術緊密結合,激發(fā)新的生產力。因此,數據要素對AI大模型的支持能力,完全可以作為存力的衡量指標。

未經處理的原始記錄(如日志、文本、圖像),也就是我們說的數據,一般不直接參與交易,也不能被AI大模型直接使用,這也是為什么100PB或者1EB的存儲容量不能說明問題的原因。這些原始數據要能夠被AI大模型使用,必須先經過清洗、加工、分析和處理,其中,向量化就是一個最為基礎的操作。既然如此,完全可以將向量化數據量作為數據要素的衡量指標,如果數據要素占比過低,則不宜稱為存力中心。

存力中心建設應該集中體現出數據要素的加速能力,加快數據價值的使用和釋放,這理應成為存力中心建設的重要使用目標,如果背離了這個初衷,存力中心建設極有可能成為數據中心建設的翻版。

存力中心建設是否應該像智算中心一樣單獨立項呢?

存力中心應該與智算中心一樣得到重視,但這并不意味著一定要單獨構建一個存力中心,這是因為數據要素不應離開生產力單獨存在(這里生產力應該是算力),智算中心和存力中心不應該割裂。因為數據量龐大,存力中心很難依靠網絡傳輸遠程連接智算中心。存力中心應該緊鄰智算中心,或者干脆就在同一個數據中心。二者的關系是:存力中心應該是智算中心,但是智算中心未必是存力中心。這是由數據價值釋放的這個性質決定的。

一切應該以數據價值釋放作為前提,存力中心建設應該體現出這個原則和宗旨。

存力中心存儲應該具備的能力

以釋放數據價值作為前提,這也對存儲基礎設施運作提出了新的要求。

無論是存儲容量、閃介質占比、高速網絡、分層存儲管理等等,都應該有明確的要求和衡量的指標。

考慮閃存介質占比,主要是AI大模型對數據存儲的需求,從模型訓練中的CheckPoint加載,到模型推理中的數據處理,都對存儲系統(tǒng)的性能有很高的要求,而閃存介質占比,可以作為主要衡量指標。其中,高速網絡也是保障性能不可或缺的技術,也可以作為衡量指標之一。

性能之外,數據分層存儲的管理水平也是重要的衡量指標,其中牽涉到的技術,如多協(xié)議融合互通、多元異構集群納管,目的是同一份數據,實現文件系統(tǒng)、對象存儲、大數據共享訪問,支持AI、數據交易、數據分析等上層應用。避免了數據的拷貝來,拷貝去,最大程度上體現數據的管理水平。

在此需要認真思考的問題是:數據流動并不等同于數據的自由拷貝、復制,相反,更多的數據拷貝、復制,不僅帶來存儲成本的增加,同時也恰恰反映出數據共享水平的低下。因此,存力中心需要的是高水平的數據管理,以及高效的成本控制,這應該成為存力建設的最基本的原則。

小結

以上是我對存力中心建設的一點思考,存力中心應該以數據價值釋放為根本目標,綜合考慮數據要素占比,以及存儲基礎設施的專業(yè)化。希望通過數據存儲專委會等專業(yè)機構,從專業(yè)的角度給出完整的存力中心建設衡量標準,促進存力中心的健康發(fā)展。

分享到

songjy

相關推薦