斯坦福報告：AI透明度集體倒退！IBM奪冠，馬斯克xAI墊底

2026-03-15 人工智能 ai ibm 伊隆·馬斯克阿里巴巴

文章圖片

最近，美國斯坦福大學等團隊發布了一份名為《2025 年基礎模型透明度指數》（FMTI ， The 2025 Foundation Model Transparency Index）的報告。其中， IBM 以透明度得分最高奪冠， xAI 和 Midjourney 則墊底。

該報告揭示了一種令人擔憂的趨勢：隨著技術的發展，盡管基礎模型在性能等各方面持續進步，但其在數據使用、模型訓練和下游影響等方面的透明度卻出現了集體倒退。

這是該報告自 2023 年以來發布的第三個年度版本，就像通過量化透明度為各大基礎模型開發者做一次“體檢” 。

本次評估共包括 13 家基礎模型公司，其中既有阿里巴巴、DeepSeek 和馬斯克的 xAI 等首次納入報告的企業，也有 IBM、OpenAI 等老牌科技巨頭。為使評估更全面，今年的報告中還涵蓋了數據獲取、使用數據和監控等方面的新指標。

【斯坦福報告：AI透明度集體倒退！IBM奪冠，馬斯克xAI墊底】圖丨按領域劃分的各模型得分（來源：The 2025 Foundation Model Transparency Index）

從報告的整體結果來看，盡管 2024 年報告顯示模型透明度有短暫的改善，但 2025 年的報告指出，透明度指數正呈現倒退：各基礎模型的平均得分從 2024 年的 58 分下降到 2025 年的 40 分，幾乎與 2023 年報告首次發布時的水平相當（備注：100 分為滿分）。

報告顯示，公司在其旗艦模型的訓練數據、訓練計算以及模型部署后的使用和影響方面信息披露最為有限。盡管公司在模型能力評估和風險評估方面披露較多，但在方法透明度、第三方參與、可復現性和訓練-測試數據重疊報告方面仍存在挑戰。

（來源：The 2025 Foundation Model Transparency Index）

從各公司的表現來看差異明顯，其中 IBM 以 95 分獲得透明度最高得分， xAI 和 Midjourney 得分最低，僅 14 分。中國的兩家公司 DeepSeek 和阿里巴巴在透明度的得分則位于中下游。

可以看到的是，公司特征和透明度指數在某些程度上存在著一些有趣的關聯，例如開放模型開發者、以企業為中心的 B2B 公司、自行準備透明度報告的公司以及簽署歐盟 AI 法案通用目的 AI 行為準則的公司得分高于平均水平。

（來源：The 2025 Foundation Model Transparency Index）

那么，透明度越高就意味著模型越好嗎？

清華大學邱寒副教授告訴 DeepTech ， “這里的透明度不等同于我們常識認為的開源，而是由一系列明確的打分表組成的量化指標——如果不按照這個指標披露相關的數據（而不是什么都沒披露），那么這項指標得分就是 0 。 ”
以阿里巴巴 Qwen 和 DeepSeek 得分均為 0 的使用數據、影響、部署后監控三項指標為例：它們都各自含有更詳細的評測指標，得分為 0 并不等于什么都沒有披露，而這些計算指標的方法與開源、安全、性能并不能直接劃等號。

需要了解的是，透明或開源也并不意味著模型性能更好。從這份報告來看，透明度得分最高的模型（IBM 的 Granite 3.3），在實際應用場景種的性能表現并不是最頂尖的那批模型。

試想一下，如果有一個任務要做，你是會去選擇微調 Qwen3 或 Claude 的 API ，還是會因為透明度得分更高而選擇 Granite 3.3？

邱寒認為，透明度是安全的前提，但必須明確不一定是報告中定義的透明：如果公司拒絕披露任何模型生產相關的信息，比如版權內容、隱私數據的濫用確實難以發掘和確認；模型的偏見和價值觀更難評測，確實會給安全和治理帶來一定的影響。更糟的是，一旦嚴重安全事故發生，還可能引發更粗暴的安全監管策略落地，反而進一步限制了大模型技術的進步。

該報告提到，隨著全球政策制定者越來越多地要求某些類型的透明度，這項工作揭示了基礎模型開發者的當前透明度狀態，透明度可能如何變化，以及需要更積極的政策干預來解決哪些關鍵信息問題。

正如邱寒所指出的那樣，黑盒模型的評測技術可以在一定程度上彌補不透明的問題，而當前的透明與否也只是暫時狀態。隨著模型落地的深化和監管機制的完善，最終目標是“公司不需完全公開，但模型行為可測、聲明可證、安全可控” 。

總之，表面上看公司信息披露程度影響透明度，但本質上這需要一種權責歸屬的清晰界定。通過這份報告對透明度倒退的警示，我們需要看到，未來需要構建一種綜合的激勵機制，來理解、評估并最終確保模型的安全與可信。

參考資料：
https://arxiv.org/abs/2512.10169

運營/排版：何晨龍

推薦閱讀

上一篇：從更舒適到更智能：耳夾耳機為何成為新風口？

下一篇：年薪百萬！美國政府組建千人科技“特種部隊”，蘋果OpenAI英偉達全去了