問:從您的研究視角看,目前哪些場景的數(shù)字化轉(zhuǎn)型已初見成效?還有哪些領(lǐng)域的數(shù)據(jù)價值尚未被充分挖掘?
張向宏:國家數(shù)據(jù)局成立以來,通過實施“數(shù)據(jù)要素×”行動計劃、國家數(shù)據(jù)要素綜合示范區(qū)、國家數(shù)字經(jīng)濟創(chuàng)新發(fā)展試驗區(qū)、公共數(shù)據(jù)“跑起來”、國家數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)、國家數(shù)據(jù)標(biāo)注基地建設(shè)、城市全域數(shù)字化轉(zhuǎn)型、數(shù)據(jù)產(chǎn)業(yè)集聚區(qū)、高質(zhì)量數(shù)據(jù)集建設(shè)、可信數(shù)據(jù)空間建設(shè)等一系列試點示范工程,逐步探索出了一條行之有效的數(shù)據(jù)資源“供得出、流的動、用的好、保安全”路徑,有效促進了各行各業(yè)的數(shù)據(jù)資源開發(fā)利用和數(shù)字化轉(zhuǎn)型。總體來看,各領(lǐng)域數(shù)字化轉(zhuǎn)型可以分為四個梯隊:
第一梯隊是互聯(lián)網(wǎng)、金融、商貿(mào)流通等行業(yè),數(shù)字化轉(zhuǎn)型深度和廣度不斷拓展,面向數(shù)據(jù)的生產(chǎn)經(jīng)營、管理決策、供應(yīng)鏈管理、客戶管理等垂直大模型、智能體等數(shù)據(jù)系統(tǒng)應(yīng)用越來越廣泛,正在快速替代面向流程和業(yè)務(wù)的信息化系統(tǒng)。
第二梯隊是氣象、時空、醫(yī)療、交通等行業(yè),數(shù)據(jù)采集匯聚規(guī)模大、質(zhì)量高,數(shù)據(jù)在本行業(yè)和跨領(lǐng)域的應(yīng)用越來越普遍,人工智能垂直大模型和智能體等應(yīng)用不斷增多。
第三梯隊是政務(wù)服務(wù)、社會管理、高端制造業(yè)等領(lǐng)域,大多數(shù)處于信息系統(tǒng)建設(shè)運營階段,數(shù)據(jù)資源采集匯聚不斷增強,但數(shù)據(jù)資源加工處理仍然滯后,數(shù)據(jù)應(yīng)用還處于初級階段。
第四梯隊是中小企業(yè)、農(nóng)業(yè)等領(lǐng)域,大多數(shù)還處于信息化初級階段,信息系統(tǒng)還沒有建設(shè)應(yīng)用,數(shù)據(jù)資源還未得到充分重視,數(shù)據(jù)還沒有得到應(yīng)用。
問:數(shù)據(jù)要素市場化是當(dāng)前的熱點,您認(rèn)為不同行業(yè)在數(shù)據(jù)確權(quán)、定價、交易等環(huán)節(jié)存在哪些共性難題?結(jié)合您的研究,有哪些針對性的解決思路?
張向宏:數(shù)據(jù)是一種新型生產(chǎn)要素,具有與土地、勞動力、技術(shù)、資本等傳統(tǒng)生產(chǎn)要素迵然不同的新特點,如數(shù)據(jù)的多環(huán)節(jié)性和低成本易復(fù)制性特點,決定了數(shù)據(jù)要素很難確權(quán)或者確權(quán)成本很高;數(shù)據(jù)的阿羅信息悖論效應(yīng)特征,決定了數(shù)據(jù)很難實現(xiàn)場內(nèi)規(guī)模交易;數(shù)據(jù)價值不確定性特征,決定了數(shù)據(jù)價值易變、很難定價。
面向人工智能的行業(yè)高質(zhì)量數(shù)據(jù)集構(gòu)建是解決數(shù)據(jù)要素化價值化的一條可行路徑。從數(shù)據(jù)要素化的具體實踐來看,數(shù)據(jù)要素化價值化絕不能陷入傳統(tǒng)要素的慣性路線中,或者說,簡單地將傳統(tǒng)要素的做法移植到數(shù)據(jù)要素中,是行不通的。當(dāng)前,一方面是人工智能應(yīng)用普及對數(shù)據(jù)資源需求日益迫切,另一方面是國家層面對數(shù)據(jù)資源開發(fā)利用制度供給不斷加大,兩端相向而行,已形成一條清晰的面向人工智能的數(shù)據(jù)產(chǎn)業(yè)鏈條。
數(shù)據(jù)產(chǎn)業(yè)鏈條的下游是垂域大模型在千行百業(yè)的應(yīng)用;中下游是在基礎(chǔ)大模型上加上大規(guī)模的行業(yè)高質(zhì)量數(shù)據(jù)集,訓(xùn)練和調(diào)優(yōu)而成的各種垂域大模型;中上游是在各行業(yè)采集匯聚的海量數(shù)據(jù)資源基礎(chǔ)上,加工生產(chǎn)出的規(guī)模化、標(biāo)準(zhǔn)化、體系化高質(zhì)量數(shù)據(jù)集;上游是各行各業(yè)的數(shù)據(jù)資源供給。而這條“數(shù)據(jù)資源—高質(zhì)量數(shù)據(jù)集—垂域大模型—千行百業(yè)應(yīng)用”數(shù)據(jù)產(chǎn)業(yè)鏈,都需要在數(shù)據(jù)基礎(chǔ)設(shè)施中實現(xiàn)。
問:隨著各行業(yè)數(shù)據(jù)量爆發(fā)式增長,數(shù)據(jù)存儲、算力支撐、算法優(yōu)化等基礎(chǔ)設(shè)施層面面臨哪些新挑戰(zhàn)?您覺得技術(shù)突破的關(guān)鍵方向在哪里?
張向宏:算力和模型對人工智能應(yīng)用的制約已大大緩解。算力、算法和數(shù)據(jù)是人工智能的三個關(guān)鍵要素,長期以來,高耗算力、模型閉源和數(shù)據(jù)短缺一直制約著人工智能大模型的應(yīng)用普及。以DeepSeek為代表的人工智能企業(yè),實現(xiàn)了MOE等關(guān)鍵技術(shù)重大突破,并采取了模型開源策略,實現(xiàn)了“算力平權(quán)”和“算法平權(quán)”,突破了人工智能三要素中的兩大要素制約,促進人工智能大模型向通信、互聯(lián)網(wǎng)、汽車、能源、金融、醫(yī)療、科技等各行各業(yè)加速滲透,顯著降低了成本,提高了效率,并優(yōu)化了用戶體驗,人工智能大模型廣泛應(yīng)用的時代已經(jīng)到來。
高質(zhì)量數(shù)據(jù)集是成為決定大模型質(zhì)量的關(guān)鍵因素。DeepSeek實現(xiàn)“算力平權(quán)”和“算法平權(quán)”后,“數(shù)據(jù)平權(quán)”已成為人工智能大模型發(fā)展的最后一個堡壘,高質(zhì)量數(shù)據(jù)集的供給規(guī)模和質(zhì)量已成為決定人工智能大模型在各行業(yè)領(lǐng)域滲透速度和應(yīng)用水平的最關(guān)鍵因素。在同等計算資源下,決定生成模型的因素中,高質(zhì)量數(shù)據(jù)集的規(guī)模大小遠比算法模型規(guī)模大小更加重要。而在使用醫(yī)學(xué)數(shù)據(jù)訓(xùn)練大模型過程中,即使醫(yī)療數(shù)據(jù)集中含有0.001%的錯誤信息,也可能導(dǎo)致模型輸出不準(zhǔn)確的醫(yī)學(xué)答案。
垂域大模型正廣泛應(yīng)用于企業(yè)的生產(chǎn)、管理、經(jīng)營,企業(yè)的核心競爭力取決于其垂域大模型的“聰明”程度和“熟練”程度等大模型能力。垂域大模型的訓(xùn)練和推理高度依賴高質(zhì)量數(shù)據(jù)集的供給。高質(zhì)量數(shù)據(jù)集的規(guī)模和質(zhì)量直接影響人工智能大模型的“智商”水平,高質(zhì)量數(shù)據(jù)集已成為企業(yè)的核心競爭力和真正的“護城河”。
私域數(shù)據(jù)安全流通成為制約高質(zhì)量數(shù)據(jù)集建設(shè)的關(guān)鍵瓶頸。全球數(shù)據(jù)資源中20%是公域數(shù)據(jù),也稱作可流通數(shù)據(jù),80%是私域數(shù)據(jù),或稱不可流通數(shù)據(jù)。在20%的公域數(shù)據(jù)中,只有4%的數(shù)據(jù)是能在互聯(lián)網(wǎng)上流通的格式化數(shù)據(jù),其他16%的多模態(tài)數(shù)據(jù)不能在互聯(lián)網(wǎng)上直接流通。當(dāng)前,人工智能大模型對數(shù)據(jù)的消耗量越來越大,預(yù)計2028年互聯(lián)網(wǎng)上流通的數(shù)據(jù)將全部耗盡。
在互聯(lián)網(wǎng)上可流通數(shù)據(jù)將全部耗盡的背景下,人工智能大模型的聰明程度、智商水平和應(yīng)用普及程度,將越來越多地取決于多模態(tài)數(shù)據(jù)和私域數(shù)據(jù)的安全高效流通程度,特別是私域數(shù)據(jù)的安全流通已成為世界各國必須解決的一個普遍性問題。這就需要從思想觀念和管理體制機制方面,從傳統(tǒng)數(shù)據(jù)靜態(tài)安全轉(zhuǎn)變到數(shù)據(jù)動態(tài)安全上來。建設(shè)一個既能促進私域數(shù)據(jù)大規(guī)模、高效流通,又能確保流通過程中安全的數(shù)據(jù)流通利用基礎(chǔ)設(shè)施,成為私域數(shù)據(jù)安全高效流通的基礎(chǔ)和前提。
問:數(shù)博會作為數(shù)據(jù)領(lǐng)域的重要平臺,您有什么樣的參會經(jīng)歷或印象?您認(rèn)為它在推動數(shù)據(jù)技術(shù)創(chuàng)新、促進產(chǎn)學(xué)研合作方面,起到了哪些關(guān)鍵作用?
張向宏:數(shù)博會是全球首個以大數(shù)據(jù)為主題的博覽會,也是我國數(shù)據(jù)領(lǐng)域的兩大國家級平臺之一,得到了黨中央、國務(wù)院的高度肯定和支持,傾注了國家數(shù)據(jù)局和貴州省、貴陽市的大量心血,吸引了全國乃至世界各地數(shù)據(jù)領(lǐng)域政府、企業(yè)、大學(xué)、科研機構(gòu)等參與,不僅已成為數(shù)據(jù)成果展示、技術(shù)交流、應(yīng)用合作的一個全球性平臺,更是推動產(chǎn)學(xué)研深度融合、促進數(shù)字經(jīng)濟高質(zhì)量發(fā)展的重要引擎。在推動數(shù)據(jù)技術(shù)創(chuàng)新和產(chǎn)學(xué)研合作方面發(fā)揮了重要作用,主要體現(xiàn)在以下幾個方面:
一是引領(lǐng)行業(yè)技術(shù)方向,促進前沿技術(shù)應(yīng)用。數(shù)博會聚焦大數(shù)據(jù)、人工智能、云計算等前沿技術(shù),為職業(yè)教育和技術(shù)研發(fā)提供了清晰的行業(yè)風(fēng)向標(biāo)。
二是搭建校企合作平臺,深化產(chǎn)教融合。數(shù)博會聚集了華為、騰訊、螞蟻等科技企業(yè),為高校和企業(yè)搭建合作平臺,促進訂單班、實訓(xùn)基地共建等深度合作。2025數(shù)博會還通過“數(shù)字人才培養(yǎng)”活動,匯聚政府、高校、企業(yè)、研究機構(gòu)等多方力量,探討產(chǎn)學(xué)研用協(xié)同育人模式。
三是促進跨區(qū)域、跨領(lǐng)域協(xié)同創(chuàng)新。數(shù)博會連接了全國甚至世界各地在數(shù)據(jù)領(lǐng)域的合作。如深圳市大數(shù)據(jù)研究院與香港中文大學(xué)(深圳)合作,在貴陽大數(shù)據(jù)科創(chuàng)城開展人工智能研究,賦能區(qū)域數(shù)字化轉(zhuǎn)型。
問:您認(rèn)為未來數(shù)博會在聚焦數(shù)據(jù)領(lǐng)域的深度、推動產(chǎn)業(yè)落地等方面,還有哪些可以優(yōu)化或加強的地方?
張向宏:未來的數(shù)博會,應(yīng)在三個維度上更加突出應(yīng)用、突出產(chǎn)業(yè)。
一是更加重視面向人工智能應(yīng)用的高質(zhì)量數(shù)據(jù)集建設(shè)。建議設(shè)立人工智能+專場和高質(zhì)量數(shù)據(jù)集建設(shè)專場,展示和交流各行各業(yè)人工智能最新應(yīng)用和行業(yè)高質(zhì)量數(shù)據(jù)集建設(shè)最佳實踐。
二是更加重視傳統(tǒng)產(chǎn)業(yè)的數(shù)字化轉(zhuǎn)型。建議設(shè)立傳統(tǒng)產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型專場,引導(dǎo)和示范不同領(lǐng)域不同階段的傳統(tǒng)產(chǎn)業(yè),梯度開展信息系統(tǒng)(IT)、商業(yè)智能(BI)、人工智能(AI)應(yīng)用。
三是更加重視數(shù)據(jù)要素的普惠化應(yīng)用。建議設(shè)立國家數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)專場,引導(dǎo)各級政府和技術(shù)服務(wù)企業(yè),一方面不斷突破數(shù)據(jù)安全流通技術(shù),另一方面加大數(shù)據(jù)安全流通技術(shù)的應(yīng)用范圍,建設(shè)普惠互聯(lián)、協(xié)調(diào)有力的全國一體化數(shù)據(jù)基礎(chǔ)設(shè)施,為數(shù)據(jù)大規(guī)模流通提供可信安全環(huán)境,實現(xiàn)“數(shù)據(jù)自由”。
問:站在數(shù)據(jù)領(lǐng)域發(fā)展的角度,您對數(shù)博會舉辦地貴州的長遠發(fā)展有什么寄語或期待?
張向宏:數(shù)博會已走過了11年的不平凡歷程,面向下一個10年,以至將來50年,希望貴州打造成為全國乃至全球的“兩地四區(qū)”,“兩地”即數(shù)據(jù)技術(shù)策源地和數(shù)據(jù)制度新高地;“四區(qū)”即數(shù)據(jù)應(yīng)用引領(lǐng)區(qū)、數(shù)據(jù)安全先行區(qū)、數(shù)據(jù)資源匯聚區(qū)和數(shù)據(jù)流通示范區(qū)。