上海WAIC 2025期間,中國移動(dòng)與曙光存儲(chǔ)共同舉行了“算力中心全局統(tǒng)一文件存儲(chǔ)系統(tǒng)”的落地儀式,該平臺(tái)是國內(nèi)首個(gè)智能存力調(diào)度平臺(tái)的正式落地。

這一舉措被業(yè)內(nèi)視為繼“東數(shù)西算”工程啟動(dòng)以來,存儲(chǔ)領(lǐng)域最具標(biāo)志性的節(jié)點(diǎn)事件:它首次把“算力網(wǎng)絡(luò)”所缺失的“存力中樞”補(bǔ)全,讓數(shù)據(jù)真正像電力一樣,在全國范圍可調(diào)度、可定價(jià)、可交易。

平臺(tái)之魂:“中樞神經(jīng)”如何運(yùn)轉(zhuǎn)

“智能存力跨域調(diào)度平臺(tái)”被明確定位為“先進(jìn)存力中心的中樞神經(jīng)”,承擔(dān)起全局?jǐn)?shù)據(jù)統(tǒng)一管理、跨域資源調(diào)度的關(guān)鍵角色,如同連接全國存力資源的“智慧大腦”,實(shí)現(xiàn)不同區(qū)域、不同廠商存儲(chǔ)系統(tǒng)的協(xié)同運(yùn)作。其核心是一套橫跨4000千米的全局文件系統(tǒng),具備三大特性:一是資源動(dòng)態(tài)調(diào)配:通過AI預(yù)測模型,把90天未被訪問的數(shù)據(jù)自動(dòng)下沉到西部冷池,熱數(shù)據(jù)則彈性上浮到距GPU兩跳以內(nèi);二是異構(gòu)整合:內(nèi)置8類協(xié)議網(wǎng)關(guān),納管不同廠家存儲(chǔ)系統(tǒng),遷移時(shí)間從周級(jí)縮至小時(shí)級(jí);三是跨域無感訪問——芯片級(jí)“超級(jí)隧道”全面優(yōu)化加速,數(shù)據(jù)傳輸延遲降至毫秒級(jí),用戶體感與本地盤無異。

對(duì)企業(yè)而言,該平臺(tái)解決了數(shù)據(jù)管理分散、流動(dòng)低效的問題,降低了AI應(yīng)用落地成本;對(duì)社會(huì)而言,其完善了全國一體化算力網(wǎng)絡(luò),加速數(shù)據(jù)要素市場化進(jìn)程,為“東數(shù)西算”戰(zhàn)略提供堅(jiān)實(shí)支撐。

目前,智能存力調(diào)度平臺(tái)已在中國移動(dòng)的多區(qū)域節(jié)點(diǎn)落地,其技術(shù)架構(gòu)具備通用性。電信、聯(lián)通等運(yùn)營商同樣存在存力整合需求。

作為“東數(shù)西算”戰(zhàn)略的重要承載平臺(tái),智能存力調(diào)度平臺(tái)已率先覆蓋長三角、成渝、內(nèi)蒙古、貴州四大國家級(jí)樞紐節(jié)點(diǎn),覆蓋橫跨東西、聯(lián)動(dòng)南北的七大存力資源池。全套方案自主可控,兼容全球8種AI芯片,對(duì)穩(wěn)定推動(dòng)國家數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展意義重大。

二十年回望:AI存儲(chǔ)的長征

20多年來,曙光存儲(chǔ)始終聚焦存力平臺(tái)建設(shè),以全棧自研技術(shù)為核心,從底層硬件到上層軟件實(shí)現(xiàn)自主創(chuàng)新,在這個(gè)過程中沉淀了豐富的建設(shè)經(jīng)驗(yàn)。曙光存儲(chǔ)副總裁楊志雷表示,曙光存儲(chǔ)通過與運(yùn)營商、云服務(wù)商等合作伙伴深度協(xié)同,累計(jì)部署上千套存儲(chǔ)系統(tǒng),構(gòu)建了高效、可靠的存儲(chǔ)基礎(chǔ)設(shè)施。

針對(duì)人工智能市場的異軍突起,曙光存儲(chǔ)不斷突破新的天花板,以更高效、更安全更可靠的高速并行分布式文件存儲(chǔ)系統(tǒng)支持大模型訓(xùn)練的高帶寬需求。2023年起,大模型六小龍中的五家訓(xùn)練底座已應(yīng)用曙光全閃,在推理場景,通過優(yōu)化數(shù)據(jù)路徑、存儲(chǔ)上下文信息,實(shí)現(xiàn)每秒2000-3000 token的生成速度。

“無論是去年發(fā)布的高速并行分布式文件系統(tǒng)存儲(chǔ),還是今年即將基于國產(chǎn)化芯片的、追求更極致的兩路兩節(jié)點(diǎn)、190GB/s以上帶寬的存儲(chǔ)性能的節(jié)點(diǎn),以國際領(lǐng)先水平充分釋放前端的計(jì)算平臺(tái)的算力能力。”楊志雷強(qiáng)調(diào)說。

在人工智能應(yīng)用賽道,無論是訓(xùn)練還是推理場景,對(duì)存儲(chǔ)的需求都有一些差異化。比如訓(xùn)練場景除了能存能快速訪問,還離不開安全管理,不同的訓(xùn)練模型相互之間也要實(shí)現(xiàn)數(shù)據(jù)隔離。曙光存儲(chǔ)從軟件層面,與基礎(chǔ)設(shè)施的性能調(diào)優(yōu)層面都已經(jīng)全面實(shí)現(xiàn)了這方面的能力,并且也都付諸了實(shí)踐。

以自動(dòng)駕駛領(lǐng)域?yàn)槔?,曙光存?chǔ)定制化方案覆蓋數(shù)據(jù)采集、脫敏、訓(xùn)練全流程,避免用戶重復(fù)采購存儲(chǔ)設(shè)備,提升數(shù)據(jù)流動(dòng)效率,如為某頭部車企定制“路測-脫敏-訓(xùn)練-仿真”四級(jí)存儲(chǔ)池,數(shù)據(jù)在24小時(shí)內(nèi)完成3PB流轉(zhuǎn),模型迭代周期從周級(jí)壓縮到48小時(shí);在醫(yī)療影像場景,15年P(guān)ACS冷數(shù)據(jù)被自動(dòng)分級(jí)下沉,院內(nèi)本地盤節(jié)省60%,醫(yī)生調(diào)閱30年前的CT片只需2秒。

可以說,曙光的定制化能力,重新定義了存儲(chǔ)與場景的適配標(biāo)準(zhǔn)。

核心自主創(chuàng)新:構(gòu)建核心護(hù)城河

中科曙光在自主可控領(lǐng)域成效顯著。曙光存儲(chǔ)現(xiàn)有千余名研發(fā)人員,代碼自有率100%。今年5月,集中式存儲(chǔ)在SPC-1榜單以3000萬IOPS、0.202ms延遲登頂世界第一,打破國外高端陣列15年壟斷;技術(shù)上,從芯片到軟件全棧自研,“超級(jí)隧道”加速技術(shù)、國產(chǎn)化芯片適配等核心能力形成競爭壁壘,成為公有云廠商的核心供應(yīng)商,其國產(chǎn)化成果不僅滿足數(shù)據(jù)安全需求,更在中美科技競爭中凸顯戰(zhàn)略價(jià)值,構(gòu)建起難以復(fù)制的技術(shù)護(hù)城河。

曙光存儲(chǔ)總裁何振表示,性能領(lǐng)先只是第一張門票,全??煽夭攀亲o(hù)城河。

應(yīng)對(duì)市場趨勢:全閃存布局與未來方向

面對(duì)全閃存市場擴(kuò)大的趨勢,曙光存儲(chǔ)已實(shí)現(xiàn)全閃存儲(chǔ)占比從3年前10%到如今30%的躍升。

在將存力與AI算力相結(jié)合應(yīng)用的創(chuàng)新方面,曙光存儲(chǔ)副總裁張新鳳舉例介紹了曙光存儲(chǔ)兩大努力方向:一是高性能傳承,依托多年高性能計(jì)算經(jīng)驗(yàn),把“榨干硬件性能”的方法論沿用到AI領(lǐng)域,實(shí)現(xiàn)超低延遲,盡可能提升GPU資源的利用率,百倍IOPS、10TB級(jí)帶寬,將硬件潛力一次挖盡,二是建立面向行業(yè)的向量數(shù)據(jù)庫,實(shí)現(xiàn)精準(zhǔn)回答,減少訓(xùn)練推理的幻覺,從而加速數(shù)據(jù)平權(quán),AI普惠的目標(biāo)。

曙光存儲(chǔ)用20多年把“存力”從配角推向舞臺(tái)中央。隨著智能存力跨域調(diào)度平臺(tái)落地,東西部數(shù)據(jù)第一次真正意義上“同盤共舞”,數(shù)據(jù)要素的市場化交易也因此邁出可度量的第一步。

未來,曙光存儲(chǔ)將持續(xù)以技術(shù)創(chuàng)新響應(yīng)國家戰(zhàn)略與市場需求,讓智能存力成為數(shù)字經(jīng)濟(jì)發(fā)展的核心引擎。未來,曙光要成為中國的EMC。

分享到

xiesc

相關(guān)推薦