斯坦福報告:AI透明度集體倒退!IBM奪冠,馬斯克xAI墊底

斯坦福報告:AI透明度集體倒退!IBM奪冠,馬斯克xAI墊底

文章圖片

斯坦福報告:AI透明度集體倒退!IBM奪冠,馬斯克xAI墊底

最近 , 美國斯坦福大學等團隊發布了一份名為《2025 年基礎模型透明度指數》(FMTI , The 2025 Foundation Model Transparency Index)的報告 。 其中 , IBM 以透明度得分最高奪冠 , xAI 和 Midjourney 則墊底 。

該報告揭示了一種令人擔憂的趨勢:隨著技術的發展 , 盡管基礎模型在性能等各方面持續進步 , 但其在數據使用、模型訓練和下游影響等方面的透明度卻出現了集體倒退 。

這是該報告自 2023 年以來發布的第三個年度版本 , 就像通過量化透明度為各大基礎模型開發者做一次“體檢” 。

本次評估共包括 13 家基礎模型公司 , 其中既有阿里巴巴、DeepSeek 和馬斯克的 xAI 等首次納入報告的企業 , 也有 IBM、OpenAI 等老牌科技巨頭 。 為使評估更全面 , 今年的報告中還涵蓋了數據獲取、使用數據和監控等方面的新指標 。


【斯坦福報告:AI透明度集體倒退!IBM奪冠,馬斯克xAI墊底】圖丨按領域劃分的各模型得分(來源:The 2025 Foundation Model Transparency Index)

從報告的整體結果來看 , 盡管 2024 年報告顯示模型透明度有短暫的改善 , 但 2025 年的報告指出 , 透明度指數正呈現倒退:各基礎模型的平均得分從 2024 年的 58 分下降到 2025 年的 40 分 , 幾乎與 2023 年報告首次發布時的水平相當(備注:100 分為滿分) 。

報告顯示 , 公司在其旗艦模型的訓練數據、訓練計算以及模型部署后的使用和影響方面信息披露最為有限 。 盡管公司在模型能力評估和風險評估方面披露較多 , 但在方法透明度、第三方參與、可復現性和訓練-測試數據重疊報告方面仍存在挑戰 。


(來源:The 2025 Foundation Model Transparency Index)

從各公司的表現來看差異明顯 , 其中 IBM 以 95 分獲得透明度最高得分 , xAI 和 Midjourney 得分最低 , 僅 14 分 。 中國的兩家公司 DeepSeek 和阿里巴巴在透明度的得分則位于中下游 。

可以看到的是 , 公司特征和透明度指數在某些程度上存在著一些有趣的關聯 , 例如開放模型開發者、以企業為中心的 B2B 公司、自行準備透明度報告的公司以及簽署歐盟 AI 法案通用目的 AI 行為準則的公司得分高于平均水平 。


(來源:The 2025 Foundation Model Transparency Index)

那么 , 透明度越高就意味著模型越好嗎?

清華大學邱寒副教授告訴 DeepTech , “這里的透明度不等同于我們常識認為的開源 , 而是由一系列明確的打分表組成的量化指標——如果不按照這個指標披露相關的數據(而不是什么都沒披露) , 那么這項指標得分就是 0 。 ”
以阿里巴巴 Qwen 和 DeepSeek 得分均為 0 的使用數據、影響、部署后監控三項指標為例:它們都各自含有更詳細的評測指標 , 得分為 0 并不等于什么都沒有披露 , 而這些計算指標的方法與開源、安全、性能并不能直接劃等號 。

需要了解的是 , 透明或開源也并不意味著模型性能更好 。 從這份報告來看 , 透明度得分最高的模型(IBM 的 Granite 3.3) , 在實際應用場景種的性能表現并不是最頂尖的那批模型 。

試想一下 , 如果有一個任務要做 , 你是會去選擇微調 Qwen3 或 Claude 的 API , 還是會因為透明度得分更高而選擇 Granite 3.3?

邱寒認為 , 透明度是安全的前提 , 但必須明確不一定是報告中定義的透明:如果公司拒絕披露任何模型生產相關的信息 , 比如版權內容、隱私數據的濫用確實難以發掘和確認;模型的偏見和價值觀更難評測 , 確實會給安全和治理帶來一定的影響 。 更糟的是 , 一旦嚴重安全事故發生 , 還可能引發更粗暴的安全監管策略落地 , 反而進一步限制了大模型技術的進步 。

該報告提到 , 隨著全球政策制定者越來越多地要求某些類型的透明度 , 這項工作揭示了基礎模型開發者的當前透明度狀態 , 透明度可能如何變化 , 以及需要更積極的政策干預來解決哪些關鍵信息問題 。

正如邱寒所指出的那樣 , 黑盒模型的評測技術可以在一定程度上彌補不透明的問題 , 而當前的透明與否也只是暫時狀態 。 隨著模型落地的深化和監管機制的完善 , 最終目標是“公司不需完全公開 , 但模型行為可測、聲明可證、安全可控” 。

總之 , 表面上看公司信息披露程度影響透明度 , 但本質上這需要一種權責歸屬的清晰界定 。 通過這份報告對透明度倒退的警示 , 我們需要看到 , 未來需要構建一種綜合的激勵機制 , 來理解、評估并最終確保模型的安全與可信 。

參考資料:
https://arxiv.org/abs/2512.10169

運營/排版:何晨龍

    推薦閱讀