AI 智能體的崛起對存儲(chǔ)系統(tǒng)提出了嚴(yán)苛要求:不僅需要處理 PB 級私域數(shù)據(jù)的高效存取,更要支撐實(shí)時(shí)推理的毫秒級響應(yīng)。復(fù)旦大學(xué)團(tuán)隊(duì)研發(fā)的 “破曉” 皮秒閃存器件,擦寫速度達(dá) 400 皮秒,性能超越同技術(shù)節(jié)點(diǎn)下的 SRAM,為 AI 大模型提供了極速存儲(chǔ)支持。與此同時(shí),江波龍等企業(yè)通過自研主控芯片和 PTM 全棧定制化服務(wù),構(gòu)建了從芯片設(shè)計(jì)到封裝測試的全鏈條解決方案,滿足智能穿戴、工業(yè)物聯(lián)網(wǎng)等場景的多樣化需求。這些技術(shù)突破印證了閃存作為 AI 時(shí)代 “數(shù)字基石” 的不可替代性。
在人工智能從通用大模型向行業(yè)智能體縱深發(fā)展的關(guān)鍵節(jié)點(diǎn),2025全球閃存峰會(huì)(FMW 2025)的AI智能體與行業(yè)應(yīng)用論壇,正聚焦于一個(gè)核心命題——如何讓企業(yè)私域數(shù)據(jù)與大模型技術(shù)真正產(chǎn)生化學(xué)反應(yīng),催生能落地、可復(fù)用的行業(yè)智能解決方案。這不僅是大模型商業(yè)化的必由之路,更是存儲(chǔ)技術(shù)在AI時(shí)代實(shí)現(xiàn)價(jià)值重構(gòu)的重要戰(zhàn)場。
企業(yè)私域數(shù)據(jù)天然帶有行業(yè)屬性:金融機(jī)構(gòu)的交易日志蘊(yùn)含風(fēng)險(xiǎn)控制邏輯,制造企業(yè)的設(shè)備傳感器數(shù)據(jù)記錄著工藝參數(shù),醫(yī)療機(jī)構(gòu)的病歷文本藏著臨床決策經(jīng)驗(yàn)。這些數(shù)據(jù)若想與大模型一體機(jī)深度結(jié)合,需突破三大技術(shù)關(guān)卡。
首先是數(shù)據(jù)異構(gòu)性壁壘,非結(jié)構(gòu)化的文檔、圖像、視頻等需通過向量化技術(shù)轉(zhuǎn)化為大模型可處理的語義單元,這要求存儲(chǔ)系統(tǒng)具備高效的多模態(tài)數(shù)據(jù)解析與索引能力,例如通過動(dòng)態(tài)Embedding技術(shù)將企業(yè)知識(shí)庫轉(zhuǎn)化為高維向量空間,實(shí)現(xiàn)毫秒級的語義檢索。
其次是安全合規(guī)挑戰(zhàn),敏感數(shù)據(jù)的本地化處理需求(如醫(yī)療隱私、金融合規(guī))推動(dòng)存儲(chǔ)架構(gòu)向“數(shù)據(jù)不動(dòng)模型動(dòng)”的聯(lián)邦學(xué)習(xí)模式演進(jìn),需要存儲(chǔ)系統(tǒng)提供全鏈路加密、權(quán)限細(xì)粒度管控等功能,確保數(shù)據(jù)“可用不可見”。
最后是算力協(xié)同效率瓶頸,大模型推理時(shí)對KV Cache的高頻訪問容易形成數(shù)據(jù)搬運(yùn)瓶頸,而閃存的低延遲特性與分層存儲(chǔ)架構(gòu)(如顯存-內(nèi)存-閃存三級緩存體系)正成為破局關(guān)鍵,通過將熱數(shù)據(jù)駐留高速閃存、冷數(shù)據(jù)下沉低成本存儲(chǔ)介質(zhì),可顯著降低算力資源浪費(fèi),提升模型響應(yīng)速度。 ?
AI智能體對數(shù)據(jù)處理的實(shí)時(shí)性、規(guī)模性與多樣性要求,正重塑存儲(chǔ)技術(shù)的演進(jìn)方向。傳統(tǒng)存儲(chǔ)“存得下、找得到”的基礎(chǔ)能力,已升級為“算得快、析得準(zhǔn)”的核心競爭力。企業(yè)級SSD憑借微秒級延遲與百萬級IOPS,成為支撐大模型實(shí)時(shí)推理的標(biāo)配,其智能化演進(jìn)(如內(nèi)置AI算法預(yù)測訪問熱點(diǎn)、動(dòng)態(tài)優(yōu)化數(shù)據(jù)布局)讓存儲(chǔ)不再是被動(dòng)的后端載體,而是主動(dòng)參與算力調(diào)度的智能單元。QLC閃存的成熟則改寫了成本與性能的平衡公式,其單位容量成本較TLC降低40%以上,使PB級私域數(shù)據(jù)的長期留存與深度挖掘成為可能,尤其適合構(gòu)建行業(yè)專屬的RAG知識(shí)庫——將歷史案例、操作規(guī)范等數(shù)據(jù)轉(zhuǎn)化為可被大模型調(diào)用的知識(shí)節(jié)點(diǎn),形成“通用模型+領(lǐng)域數(shù)據(jù)”的雙輪驅(qū)動(dòng)。
在更底層的技術(shù)架構(gòu)層面,RDMA(遠(yuǎn)程直接數(shù)據(jù)存?。┡c并行文件系統(tǒng)的協(xié)同創(chuàng)新,正在打破“存儲(chǔ)墻”限制。通過RDMA技術(shù),計(jì)算節(jié)點(diǎn)可直接訪問存儲(chǔ)設(shè)備中的數(shù)據(jù),避免傳統(tǒng)網(wǎng)絡(luò)傳輸?shù)钠款i,使GPU集群的算力利用率從30%提升至70%以上;而龍存LoongStore等并行文件系統(tǒng)通過分布式架構(gòu)實(shí)現(xiàn)EB級數(shù)據(jù)的高效管理,支持?jǐn)?shù)千節(jié)點(diǎn)并發(fā)訪問,為工業(yè)AI中的產(chǎn)線實(shí)時(shí)監(jiān)控、醫(yī)療AI中的影像批量處理等場景提供了底層支撐。這些技術(shù)的融合,讓存儲(chǔ)系統(tǒng)從“數(shù)據(jù)管道”進(jìn)化為“智能引擎”,直接參與AI模型的訓(xùn)練與推理過程。
此次論壇搭建技術(shù)供給與行業(yè)需求的對話橋梁,當(dāng)技術(shù)專家探討NAND閃存制程突破(如3D堆疊層數(shù)邁向300層)如何提升存儲(chǔ)密度時(shí),企業(yè)用戶更關(guān)心如何將這些技術(shù)轉(zhuǎn)化為智能客服的響應(yīng)速度提升;當(dāng)學(xué)者分析向量化存儲(chǔ)對RAG系統(tǒng)的優(yōu)化原理時(shí),金融機(jī)構(gòu)關(guān)注的是如何在合規(guī)框架下構(gòu)建風(fēng)險(xiǎn)預(yù)警智能體。論壇將圍繞這些現(xiàn)實(shí)需求,解析存儲(chǔ)技術(shù)如何適配行業(yè)場景:例如在智能客服領(lǐng)域,通過閃存的高速讀寫能力實(shí)現(xiàn)用戶歷史對話數(shù)據(jù)的實(shí)時(shí)調(diào)取,結(jié)合大模型的上下文理解能力,讓客服系統(tǒng)從“關(guān)鍵詞匹配”升級為“意圖預(yù)測”;在制造領(lǐng)域,利用KVCache技術(shù)緩存設(shè)備實(shí)時(shí)數(shù)據(jù),通過大模型分析工藝參數(shù)異常,實(shí)現(xiàn)產(chǎn)線故障的預(yù)判與自優(yōu)化。 ?
結(jié)語:數(shù)據(jù)“存力”覺醒,激活智能體無限可能 ?
AI智能體的行業(yè)落地,本質(zhì)是“技術(shù)理性”與“行業(yè)經(jīng)驗(yàn)”的深度融合。私域數(shù)據(jù)是行業(yè)經(jīng)驗(yàn)的數(shù)字化載體,大模型是釋放數(shù)據(jù)價(jià)值的智能引擎,而存儲(chǔ)技術(shù)則是連接兩者的神經(jīng)中樞。2025全球閃存峰會(huì)的AI智能體與行業(yè)應(yīng)用論壇,正通過解構(gòu)技術(shù)細(xì)節(jié)、剖析場景痛點(diǎn)、展望融合路徑,為企業(yè)智能化轉(zhuǎn)型提供“從理念到落地”的完整圖譜。當(dāng)存儲(chǔ)不再是幕后的“數(shù)據(jù)倉庫”,而是臺(tái)前的“智能伙伴”,AI與行業(yè)的融合將真正突破“概念層”,在千行百業(yè)生根發(fā)芽。7月9日,南京金陵飯店,這場關(guān)于“存力”與“智能”的對話,值得每一個(gè)期待技術(shù)落地的從業(yè)者共同參與。
【峰會(huì)信息】