聚焦新質生產力系列之六:從算力到存力,解鎖數據要素新價值

聚焦新質生產力系列之六:從算力到存力,解鎖數據要素新價值

文章圖片

聚焦新質生產力系列之六:從算力到存力,解鎖數據要素新價值

文章圖片


【環球網科技報道 記者 張陽】在數字化浪潮以排山倒海之勢席卷全球的當下 , 數據已成為驅動社會進步和產業變革的核心要素 , 其規模正以指數級的速度瘋狂增長 。 特別是隨著人工智能(AI)技術的逐步成熟 , 大模型技術成為科技領域發展的核心熱點 , 決定大模型發展快慢的“算力” , 成為街頭巷尾的熱議話題 , 而對于“存力”話題卻讓很多人感到茫然 。
所謂“存力”也即數據存儲能力 , 隨著全球數據量以36%的年增長率持續擴張 , 預計到2030年將達到YB級規模 , 如何高效、安全地存儲這些海量數據 , 成為了讓算力將人工智能大模型發揮其應有效力的前提 。 因為也有評論認為“算力決定人工智能的底線 , 數據決定人工智能的上限” 。 而根據工業和信息化部等六部門印發的《算力基礎設施高質量發展行動計劃》認為 , 算力是集信息計算力、網絡運載力、數據存儲力于一體的新型生產力 。 在這一背景下 , 算力與存力作為數據價值釋放的“雙引擎” , 正成為新基建競爭的戰略制高點 。
近日 , 為了更好探究我國存力發展現狀、挑戰及未來趨勢 , 中國信息通信研究院組織的“存力中國行”活動正式啟動 , 首站走進廣東 , 為行業搭建了深度交流的平臺 。



“存力中國行”走進廣東 , 透視存力發展現狀
廣州華銀康醫療集團股份有限公司(簡稱華銀康集團)是以病理為核心的獨立醫學檢驗與診斷服務企業 。 作為國內病理服務的先行者 , 華銀康集團于2010年開始 , 與國內外多所重點院校共同建設“華銀康病理診斷中心” 。 目前已建立覆蓋31個省區的醫學實驗室網絡 , 全國服務客戶超過12800家 , 其中與近700家醫療機構共建高水平病理科 。



華銀康集團圍繞智慧病理的發展持續布局 , 依托“數據-算法-場景”全鏈路技術閉環 , 在行業內首創“AI+系統+設備+資源”四位一體服務模式 , 提供模塊化智慧病理解決方案 。 在233位病理專家團隊及100位標注專家的支持下 , 深度融合DeepSeek等大模型技術 , 在遠程病理的基礎上為各級醫療機構提供數字病理數據庫打造、病理AI輔助診斷、病理結構化報告以及病理全流程管理監控等服務 。
以胃活檢為例 , 胃活檢診斷具有極高的復雜性 , 對于處在病情發展中或少量異型細胞存在的情況 , 模型可通過提示性文字和對應區域展示 , 針對非明確的散落的可疑異型細胞進行建議性提示 。 系統針對于胃癌的敏感性超過99% , 特異性達90% , 有效防止漏診與誤診 。 通過AI分析后 , 會輸出整體診斷建議、熱力圖及色階圖 , 幫助醫生快速定位可疑病變區域 , 最終由病理醫生完成診斷 。



華銀康在發展過程中遇到的一大難題就是數據存儲 , 全集團年檢測標本量約4000萬例 , 每一張完整病理圖像都需要近1GB存儲空間 , 同時還要保障能夠快速調用這些圖片供AI與病理醫生進行分析診斷 , 如果全部完整使用、歸檔所需要的存儲空間以及設備成本將是一個天文數字 。 所以華銀康采用了切片方式對病理圖像數據進行處理 , 僅保留病灶部位的圖像切片 , 并且采用了華為分布式存儲系統 , 構建安全、高效、可擴展的先進存力 , 并通過高效的壓縮技術降低存儲空間壓力 , 盡管如此 , 集團的機房內每年需要擴展的存儲容量仍然在PB級別 。
數據要素化催生存力新基建
華銀康集團面臨的難題可以說是AI時代發展的縮影 , 隨著人工智能的爆發式增長和數據總量的指數級躍升 , 存儲已從傳統的“數據容器”躍遷為支撐數字經濟高質量發展的戰略基座 , 是激活數據要素價值、培育新質生產力的核心引擎 。
中國信通院副院長王志勤介紹 , 我國存力建設取得顯著成效 , 截至2024年底 , 全國存力總規模已達1580EB , 先進存儲占比提升至28% 。 然而 , 仍面臨“存而不用、用而不深”、核心芯片、軟件、介質短板以及存算運協同效率待提升等挑戰 。 為此 , 她提出三大建議:探索最優路徑 , 共享最佳實踐;聚焦存力服務普惠與效能提升;強化技術攻關與產業協同生態構建 。
華為數據存儲產品線戰略與業務發展部總裁王旭東對此也深表認同 。 王旭東在接受記者專訪時開門見山地指出:“AI時代是數據的黃金時代 , 更是算力與存力協同進化的時代 。 ”當DeepSeek等大模型引發產業變革后 , 數據已從“沉睡資產”蛻變為驅動產業發展的核心生產要素 。 然而當前我國數據發展面臨雙重矛盾 , 記者采訪王旭東了解到:一方面2024年全國數據生產總量達41.06ZB , 同比增長25% , 但存儲總量僅2.09ZB , 數據留存率不足5.1%;另一方面存儲數據中一年內未使用的“冷數據”逐年增多 , 傳統架構下數據孤島問題嚴重 , 導致數據治理效率低下 。



這種矛盾在技術層面表現得尤為突出 。 隨著AI進入多模態時代 , 文本、視頻、圖像等異構數據融合需求激增 , 傳統網絡架構已難以支撐 。 王旭東以醫療行業為例:“醫院在構建AI大模型時 , 非結構化醫學影像數據的標注成本極高 , 傳統方式下數據準備周期長達數月 。 ”這正是存力中心建設如火如荼的核心原因——它通過規模聚數、高效治數、安全供數、產業用數四個維度 , 構建起數據從資源到資產的閉環體系 , 與算力基礎設施形成互補 , 共同破解“數據豐富但價值貧瘠”的產業困境 。
政策層面的驅動同樣顯著 。 國家數據局、工信部等部委密集出臺政策 , 將存力列為重點發展方向 , 明確提出推動行業和區域數據歸集平臺建設 。 在“東數西算”工程中 , 廣東韶關、貴州、京津冀廊坊等樞紐節點同步規劃存力中心 , 使其不僅成為數據存儲載體 , 更升級為省級備份災備中心、行業語料庫開發基地和產業聚集中心 。 “政策與技術的雙重驅動 , 讓存力中心從概念走向落地 , 成為激活數據要素價值的關鍵基礎設施 。 ”王旭東強調 。
從數據匯聚到產業賦能的全鏈條創新
王旭東告訴記者 , 在華為的實踐中 , 存力中心的價值釋放依托四大核心能力體系 , 形成了一套可復制的 “華為方案” 。
規模聚數:打破數據孤島的全局掌控力 。 面對跨區域、跨行業的數據匯聚挑戰 , 華為Omni-Dataverse通過三大創新實現數據全局可視、可管、可用:一是建立統一數據視圖 , 解決“數據在哪里”的認知難題 , 實現資產注冊0遺漏、更新0等待;二是依托智能數據目錄 , 對百億級數據進行自動標簽 , 支持秒級查找;三是構建自定義數據流通機制 , 用戶可根據需求設定跨區域、跨設備的共享策略 。
高效治數:AI 時代的數據質量鍛造廠 。 “AI大模型的競爭力高度依賴高質量數據集 。 ”王旭東以華為AI全流程工具鏈ModelEngine為例 , 闡述華為如何通過數據使能、模型使能、應用使能三方面提升數據治理效率 。 在瑞金醫院病理大模型項目中 , 基于此工具將病理數據標注周期縮短80% , 大幅降低了AI模型上線成本 。 更重要的是 , ModelEngine覆蓋了“數據預處理-模型訓練-應用部署”全流程 , 使單癌種業務AI應用上線周期縮短80% , 為醫療、制造等行業的模型落地提供了加速器 。
安全供數:數據流通的可信防護網 。 數據要素流通的前提是安全可信 。 華為構建的軟硬一體可信數據空間 , 從技術與管理雙維度保障數據流動:技術上采用可信流通策略、芯片級安全保障和端到端傳輸加密;管理上建立30+數據控制策略 , 實現全流程日志審計 。 “就像給數據敷上‘保護膜’ , 讓提供方和使用方都能放心 。 ”王旭東提到 , 這種安全體系不僅滿足合規要求 , 更解決了龍頭企業數據共享的核心顧慮——在醫療領域 , 通過所有權與使用權隔離技術 , 已推動多家三甲醫院實現數據安全共享 。
產業用數:海量數據規模集聚融合之后 , 要推動“數據+行業+場景”的深度融合 , 形成數據從采集到治理到應用的正循環 。 王旭東透露 , 在某汽車廠商場景中 , 該企業不僅依托存力中心匯聚了企業內部數據 , 還整合了城市、金融、充電樁等外部數據 , 為后續該企業的數據應用服務奠定基礎 , 并為政府部門提供體系化監管服務支撐 。
從介質突破到生態協同的破局之路
盡管存力中心發展前景廣闊 , 王旭東也坦誠指出當前產業面臨的三大核心挑戰:“國內80%以上的數據仍存儲在機械硬盤 , 而該領域核心技術長期不在國內 。 ”王旭東呼吁加速全閃存介質的應用與創新 , 他強調:“發展存力產業必須構建自主可控的產業鏈 , 從芯片到整機再到應用 , 形成完整的技術生態 , 這既是安全需求 , 也是產業升級的必然路徑 。 ”
AI應用對存儲提出了全新要求:千億級參數模型訓練需要極致性能支撐 , 邊緣推理場景需要長記憶存儲能力 。 華為通過存算協同架構 , 在訓練場景中使AI集群利用率提升30% , 在推理場景中實現數據吞吐量提升60% 。 王旭東建議:“應將AI存儲納入國家關鍵技術規劃 , 推動行業標準制定 , 通過技術創新提升我國在全球高端存儲領域的競爭力 。 ”
當前我國數據災備覆蓋率僅為34% , 遠低于發達國家水平 , 且開源軟件依賴度高 , 存在安全隱患 。 華為推出的“兩地三中心”災備方案 , 業務故障時可實現分鐘級切換 , 同時通過自研存儲操作系統降低對開源組件的依賴 。 “數據安全是存力中心的生命線 , 需要政策引導、技術創新和生態協同多管齊下 , 構建自主可控的安全底座 。 ”王旭東總結道 。
【聚焦新質生產力系列之六:從算力到存力,解鎖數據要素新價值】“就像電力改變工業時代一樣 , 存力將定義AI時代的產業新秩序 。 ”王旭東認為 , 存力中心將從三個維度重塑產業格局:在技術層面 , 存儲設備不僅是數據容器 , 更將進化為數據處理中心;在產業層面 , 以存力中心為樞紐 , 將形成數據采集、治理、交易、應用的完整產業鏈 , 催生數據服務商、AI訓練師等新興職業;在社會層面 , 數據將像水電一樣成為公共資源 , 通過存力中心的高效配置 , 推動智慧城市、精準醫療等場景的大規模落地 。 從算力到存力 , 從數據資源到數據資產 , 一場深刻的產業變革正在上演 。

    推薦閱讀