
文章圖片

文章圖片

文章圖片

文章圖片
henry 發自 凹非寺
量子位 | 公眾號 QbitAI
離職掀桌!Mistral被曝“蒸餾”DeepSeek 。
網友在推特上爆料 , 一位Mistral離職女員工群發郵件 , 直指公司多項黑幕 。
其中最勁爆的就是:Mistral最新模型疑似直接蒸餾自DeepSeek , 卻對外包裝成RL成功案例 , 并刻意歪曲基準測試結果 。
【被曝蒸餾DeepSeek還造假!歐版OpenAI塌方了】說到Mistral , 這家公司被譽為歐洲版OpenAI , 是全球開源明星玩家之一 , 模型性能一直備受好評 。
也正因為聲譽突出 , 這次爆料才顯得格外震撼 。
早在今年6月 , 就有博主通過“語言指紋”分析 , 發現Mistral-small-3.2和DeepSeek-v3很像 。
有意思的是——今年2月 , 還有網友調侃DeepSeek是“中國的Mistral” 。
結果半年過去 , 劇情反轉:Mistral不僅沒跑贏DeepSeek , 還被曝“借”了人家的成果 。
這波啊 , 這波叫回旋鏢自帶GPS , 繞半圈又精準扎回自己身上 。
Mistral蒸餾DeepSeek實錘就像我們開頭提到的 , 推特博主Sam Peach通過分析模型輸出中過度使用的詞匯模式(Slop) , 發現了Mistral-small-3.2與DeepSeek-v3之間令人驚訝的高度相似性 。
這種相似性通常很難通過獨立訓練偶然出現 , 所以很可能就是蒸餾(distillation)的結果:
Mistral-small-3.2“學習”了DeepSeek-v3的輸出風格 。
具體來說 , Sam Peach是這樣做的 。
他先統計了模型在創意寫作(creativewriting)的輸出中 , 比人類文本更常出現的詞和n-gram(詞組) 。
然后他把這些大數據整合起來 , 形成一個特征集 。
最后把這些高頻特征進行層次聚類(hierarchicalclustering) , 生成了一張“相似性圖” 。
通過比較相似性圖中模型的遠近位置 , 就可以發現Mistral-small-3.2和DeepSeek-v3在圖中非常接近 , 這就表明了它們的輸出模式高度相似 。
最新的爆料則進一步指明 , Mistral模型和DeepSeek相似不是巧合 , 而是可能使用了蒸餾 。
由于爆料人Susan Zhang的推特設置可見范圍 , 更多爆料信息暫時無從得知 。
但這里需要說明 , 蒸餾并不是一件違規的事 , 現在很多模型都是通過這一方法快速提升能力 。
Mistral的問題在于 , 可能隱藏了這部分事實 。
離職員工說 , Mistral這樣做是在假裝自家模型的強化學習有效 , 這不僅歪曲了基準測試結果 , 而且誤導公眾 。
不少人也認同這一觀點:蒸餾模型必須標注 , 保持透明性才是關鍵 。
此外還有網友表示 , 蒸餾實際上為模型開發開辟了一條捷徑 , 好讓大家不用再重復造輪子 。
官方暫無回應這事兒頗具爭議 , 除了事件本身 , 主要還在于Mistral在開源AI圈的地位不低 。
它成立于2023年 , base法國巴黎 , 一直被稱為歐洲版OpenAI 。 由前Google DeepMind的Arthur Mensch和前Meta的Guillaume Lample與Timothée Lacroix聯合創立 。
在今年8月 , Mistral被曝估值達到100億美元 , 且正在籌集新一輪10億美元融資 。
而在上一輪融資中(2024年6月) , Mistral完成了一輪由General Catalyst領投的6億歐元(6.45億美元)的融資 , 這使其估值上升至58億歐元(62億美元) , 排名全球第四(美國灣區外排名第一) 。
從公司成立以來 , Mistral一直保持開源路線 , 今年開源的模型就包括輕量級模型Mistral Small和主打編程的Mistral Code等 。
相較于主流的大語言模型 , 主打開源、小快靈的Mistral , 在多語言處理和推理能力方面具備相當的競爭力 , 在大模型市場中占據著獨特的地位 。
同時他們也推出了自家聊天機器人LeChat , 對標ChatGPT , 內置深度研究模式、原生多語言推理和高級圖像編輯等功能 。
截至目前 , Mistral官方還沒有回應 , 就在昨天他們還發布了新模型Mistral Medium V3.1 。
參考鏈接:
[1
https://x.com/sam_paech/status/1937786948380434780
[2
https://github.com/sam-paech/slop-forensics
[3
https://techcrunch.com/2025/07/18/what-is-mistral-ai-everything-to-know-about-the-openai-competitor/
[4
https://github.com/sam-paech/slop-forensics
— 完 —
量子位 QbitAI · 頭條號簽約
關注我們 , 第一時間獲知前沿科技動態
推薦閱讀
- 魅族 22 曝光:已有兩款機型入網,1.2mm 極窄邊框
- 華為Mate80系列再次被確認:多光譜鏡組+雙層OLED,陶瓷機身也在路上了
- 紅米K90 Pro再次被確認:配置亮點全梳理,或許小米16不香了
- 真我Neo8系列再次被確認:雙芯+超聲波指紋,電池容量有望8開頭
- 當游戲本被賦予“AI高靜”定義之后,一次大規模產業革命正在醞釀
- 蘋果尷尬了,4-6K高端市場,被華為、小米、VIVO打敗,排在第4
- 華為nova15曝光:6.42英寸+6020mAh電池,脫胎換骨
- 馬斯克痛失xAI大將!Grok 4締造者突然離職,長文曝最燃創業內幕
- 10億國民App絲滑升級AI應用!高德攜手通義重構的底層架構曝光
- 榮耀Magic V Flip2配置曝光,驍龍8Gen3搭配自研芯片
