\便宜\的開源AI模型實際上在消耗你的計算預算

\便宜\的開源AI模型實際上在消耗你的計算預算

【\便宜\的開源AI模型實際上在消耗你的計算預算】一項全新的綜合研究顯示 , 開源人工智能模型在執行相同任務時比閉源競爭對手消耗的計算資源明顯更多 , 這可能會削弱其成本優勢 , 并重塑企業評估AI部署策略的方式 。
這項由AI公司Nous Research進行的研究發現 , 開源模型使用的Token(AI計算的基本單位)比OpenAI和Anthropic等公司的閉源模型多1.5到4倍 。 對于簡單的知識問題 , 差距顯著擴大 , 一些開源模型使用的Token多達10倍 。
該研究團隊在周三發布的報告中寫道:\"開源模型使用的Token比閉源模型多1.5-4倍(對于簡單知識問題最多可達10倍) , 這使得它們有時每次查詢的成本更高 , 盡管每個Token的成本更低 。 \"
這些發現挑戰了AI行業的一個普遍假設 , 即開源模型相比專有替代方案具有明顯的經濟優勢 。 雖然開源模型運行時通常每個Token成本更低 , 但研究表明 , 如果它們需要更多Token來推理特定問題 , 這種優勢\"很容易被抵消\" 。
**AI成本的真相:為什么\"更便宜\"的模型可能會破壞你的預算**
該研究檢查了19個不同的AI模型 , 涵蓋三類任務:基礎知識問題、數學問題和邏輯謎題 。 團隊測量了\"Token效率\"——模型相對于其解決方案復雜性使用多少計算單位——這一指標盡管具有重大成本影響 , 但很少受到系統性研究 。
研究人員指出:\"Token效率是一個關鍵指標 , 原因有幾個實際考慮 。 雖然托管開源模型可能更便宜 , 但如果它們需要更多Token來推理特定問題 , 這種成本優勢很容易被抵消 。 \"
這種低效率在大推理模型(LRM)中尤為明顯 , 這些模型使用擴展的\"思維鏈\"來解決復雜問題 。 這些旨在逐步思考問題的模型 , 在思考應該需要最少計算的簡單問題時可能消耗數千個Token 。
對于像\"澳大利亞的首都是什么?\"這樣的基礎知識問題 , 研究發現推理模型花費\"數百個Token思考簡單的知識問題\" , 而這些問題本可以用一個詞回答 。
**哪些AI模型真正物有所值**
研究揭示了模型提供商之間的顯著差異 。 OpenAI的模型 , 特別是其o4-mini和新發布的開源gpt-oss變體 , 展現了卓越的Token效率 , 尤其是在數學問題上 。 研究發現OpenAI模型\"在數學問題上表現出極高的Token效率\" , 使用的Token比其他商業模型少多達三倍 。
在開源選項中 , 英偉達的llama-3.3-nemotron-super-49b-v1成為\"在所有領域中Token效率最高的開源模型\" , 而Magistral等公司的新模型顯示出\"異常高的Token使用量\" 。
效率差距因任務類型而顯著不同 。 雖然開源模型在數學和邏輯問題上使用的Token大約是兩倍 , 但在不需要高效推理的簡單知識問題上差異急劇擴大 。
**企業領導者需要了解的AI計算成本**
這些發現對企業AI采用具有直接影響 , 其中計算成本可能隨使用量快速擴展 。 評估AI模型的公司通常關注準確性基準和每Token定價 , 但可能忽視了現實任務的總計算需求 。
研究人員在分析總推理成本時發現:\"閉源模型更好的Token效率通??梢匝a償這些模型更高的API定價 。 \"
研究還顯示 , 閉源模型提供商似乎正在積極優化效率 。 \"閉源模型經過迭代優化以使用更少Token來降低推理成本\" , 而開源模型\"在新版本中增加了Token使用量 , 可能反映了對更好推理性能的優先考慮\" 。
**研究人員如何破解AI效率測量密碼**
研究團隊在測量不同模型架構的效率時面臨獨特挑戰 。 許多閉源模型不會透露其原始推理過程 , 而是提供內部計算的壓縮摘要 , 以防止競爭對手復制其技術 。
為了解決這個問題 , 研究人員使用完成Token——每次查詢計費的總計算單位——作為推理努力的代理 。 他們發現\"最新的閉源模型大多不會分享其原始推理軌跡\" , 而是\"使用較小的語言模型將思維鏈轉錄為摘要或壓縮表示\" 。
**AI效率的未來:接下來會發生什么**
研究人員建議 , Token效率應該與準確性一起成為未來模型開發的主要優化目標 。 他們寫道:\"更密集的CoT還將允許更高效的上下文使用 , 并可能對抗挑戰性推理任務期間的上下文退化 。 \"
OpenAI開源gpt-oss模型的發布展現了最先進的效率和\"可自由訪問的CoT\" , 可以作為優化其他開源模型的參考點 。
完整的研究數據集和評估代碼可在GitHub上獲得 , 允許其他研究人員驗證和擴展這些發現 。 隨著AI行業競相開發更強大的推理能力 , 這項研究表明真正的競爭可能不是關于誰能構建最智能的AI——而是誰能構建最高效的AI 。
畢竟 , 在一個每個Token都很重要的世界里 , 最浪費資源的模型可能會發現自己被市場淘汰 , 無論它們的思考能力有多強 。
Q&A
Q1:開源AI模型真的比閉源模型更便宜嗎?
A:不一定 。 雖然開源模型每個Token成本更低 , 但研究顯示它們執行相同任務時需要1.5到4倍的Token , 有些簡單問題甚至需要10倍Token , 這會抵消其價格優勢 , 總成本可能更高 。
Q2:為什么開源AI模型會消耗更多計算資源?
A:開源模型往往沒有經過充分的效率優化 , 特別是大推理模型使用擴展的\"思維鏈\"解決問題 , 會花費數百個Token思考本來只需一個詞就能回答的簡單問題 , 而閉源模型經過迭代優化以減少Token使用 。
Q3:企業選擇AI模型時應該關注哪些成本指標?
A:企業不應只看每Token價格和準確性基準 , 還要重點關注Token效率——即模型完成特定任務需要多少計算單位 。 總推理成本才是真正的成本衡量標準 , 包括任務所需的總Token數量 。

    推薦閱讀