Anthropic指控三家中國模型“非法蒸餾” 馬斯克：賊喊捉賊

2026-04-07 華為手機華為mate 80 華為mate80 mate80

文章圖片

新京報貝殼財經記者羅亦丹使用AI生成
北京時間2月24日，三家中國頭部AI公司DeepSeek、月之暗面、MiniMax遭到了AI編程頂流模型Claude的母公司Anthropic“點名批評” 。
Anthropic稱，這些中國公司“用2.4萬個‘馬甲賬號’進行了1600萬次對話，目的是提取Claude的能力來訓練自己的模型” ，其還創造了一個詞匯，稱這是“工業規模蒸餾攻擊” 。
不過，這一指控隨即遭到了埃隆·馬斯克無情的“嘲諷”：“他們怎么敢偷Anthropic從人類程序員那里偷來的東西”“Anthropic公司大規模竊取訓練數據，并為此支付了數十億美元的賠償金。這是不爭的事實。 ”
馬斯克在社交平臺發布的貼文
另一方面，近年來國產模型能力不斷提高，不少廠商已經將發展目標指向了Claude最引以為豪的編程能力。在被“點名”的同時， MiniMax、Kimi等國產模型的收入、調用量等指標已再創新高。中國AI公司正在用事實證明，技術封鎖和空口指控無法阻擋國產AI的發展。
蒸餾也能成“攻擊手段”？
蒸餾技術本無罪，問題在于誰在用、怎么用。
模型蒸餾是AI領域的標準訓練技術，通過讓大模型指導小模型學習，實現知識遷移和模型壓縮。例如， DeepSeek在金融場景實踐中將175B參數模型壓縮至7B ，推理成本降低98%的同時保持了95%以上核心指標；MiniMax的M2.5模型在SWE-bench Verified上達到80.2% ，與Claude Opus 4.6的80.8%幾乎持平，但成本僅為后者的1/20 。
當前，蒸餾技術被全球AI公司普遍使用，包括OpenAI、谷歌、Meta等巨頭都在自家模型上應用。事實上，就連Anthropic自己也在指控三家中國公司后，補充了一句“蒸餾法是合理的：人工智能實驗室利用蒸餾為客戶創建更小、更便宜的模型。 ”只不過，后面又跟上了一句“一些境外實驗室非法提煉美國模型后，可移除其安全防護機制，將模型技術能力應用于本國的軍事、情報及監控系統中。 ”
可以發現， Anthropic的邏輯是：蒸餾本身無罪，但當中國公司使用時，就成了“非法竊取” 。
Anthropic聲稱，通過IP地址、請求元數據等信息將“攻擊”追溯到了具體實驗室，甚至以“與員工公開資料匹配”為由指向中國公司。但目前，這些指控僅為Anthropic的“一面之詞” 。
有聲音認為，這樣的溯源方式在法律層面難以成立，蒸餾技術遷移的是功能邏輯而非直接復制數據，更貼近法律允許的“反向工程”范疇。簡單扣上“盜竊”帽子，并不能掩蓋證據薄弱的事實。
這種指控也讓人感覺是“賊喊捉賊” 。 Anthropic本身有過“竊取數據”的“黑歷史”：2025年9月， Anthropic 因大規模從LibGen、PiLiMi等盜版網站非法下載超700萬本受版權保護的圖書，并使用這些盜版書籍訓練AI模型，被迫向以作家安德里亞?巴茨（Andrea Bartz）為首的全球作家集體支付了15億美元和解金。正如馬斯克所說， “這是不爭的事實。 ”
當前， AI行業尚處于規則空白期，蒸餾技術的邊界在哪里、數據使用的底線是什么，需要全球共同制定標準。商業競爭無可厚非，但動輒扣帽子、搞雙重標準，只會阻礙技術創新與普惠。當OpenAI、谷歌、Anthropic自己都在大規模使用未經許可的數據訓練模型時，他們對“蒸餾”的指控，更像是維護既得利益的防御性反應。
不懼指責，中國AI模型奮起直追
對于Anthropic的單方面指責，月之暗面和MiniMax均未予以回應，其用意很明顯：用數據和事實說話。
DeepSeek自2026年以來發表了多篇論文，并一以貫之地開源其最新研究成果，將“降本增效”貫徹到底。同時， DeepSeek也正在對新模型進行灰度測試， V4“呼之欲出” 。
月之暗面方面向貝殼財經記者透露，在完成上一輪5億美元融資僅一個多月后，其將完成新一輪超7億美元的融資并再次超募，本輪由阿里、騰訊、五源、九安等聯合領投。新一輪100億—120億美元估值的融資已經開啟，并已收到多家機構意向。連續兩輪超12億美元的融資，創下近一年來大模型行業的最高融資紀錄。
此前字節估值突破百億美元大關用時超4年，拼多多用時超3年， Kimi僅用兩年多的時間就實現估值30多倍的增長。照此看來， Kimi有望創下國內公司從成立到估值超100億美元的最快成長速度。
而在模型的調用量方面，月之暗面旗下的Kimi K2.5大模型發布不到一個月，其近20天累計收入已超過2025年全年總收入。根據OpenRouter ， Kimi K2.5的調用量在OpenClaw的模型調用榜中排名第一。
MiniMax方面則向貝殼財經記者披露，春節前夕MiniMax 開源新一代模型 M2.5 ，發布12小時內登頂OpenRouter熱度榜，一周內登頂調用量榜首，周調用量暴漲至3.07T tokens 。 OpenRouter 整體調用量也在同步攀升。官方隨后確認， M2.5 帶動了100K至1M 長文本區間的增量調用需求，而這個區間正是Agent工作流的典型消耗場景。
【Anthropic指控三家中國模型“非法蒸餾” 馬斯克：賊喊捉賊】事實上，中國AI公司的快速進步，源于龐大的工程師群體、豐富的數據資源、完善的產業鏈，以及對開源開放路線的堅持。 DeepSeek、Kimi、MiniMax在編程、多模態、Agent等領域的突破，是技術創新與場景深化的結果。
新京報貝殼財經記者羅亦丹
編輯岳彩周
校對柳寶慶

推薦閱讀

上一篇：努比亞AI新品官宣：號稱手機新物種，將于MWC2026正式亮相

下一篇：漲幅比黃金還猛！多款相機價格暴漲近10倍，有人后悔“賣早了”