Anthropic指控三家中國模型“非法蒸餾” 馬斯克:賊喊捉賊

Anthropic指控三家中國模型“非法蒸餾” 馬斯克:賊喊捉賊

文章圖片


新京報貝殼財經記者羅亦丹使用AI生成
北京時間2月24日 , 三家中國頭部AI公司DeepSeek、月之暗面、MiniMax遭到了AI編程頂流模型Claude的母公司Anthropic“點名批評” 。
Anthropic稱 , 這些中國公司“用2.4萬個‘馬甲賬號’進行了1600萬次對話 , 目的是提取Claude的能力來訓練自己的模型” , 其還創造了一個詞匯 , 稱這是“工業規模蒸餾攻擊” 。
不過 , 這一指控隨即遭到了埃隆·馬斯克無情的“嘲諷”:“他們怎么敢偷Anthropic從人類程序員那里偷來的東西”“Anthropic公司大規模竊取訓練數據 , 并為此支付了數十億美元的賠償金 。 這是不爭的事實 。 ”
馬斯克在社交平臺發布的貼文
另一方面 , 近年來國產模型能力不斷提高 , 不少廠商已經將發展目標指向了Claude最引以為豪的編程能力 。 在被“點名”的同時 , MiniMax、Kimi等國產模型的收入、調用量等指標已再創新高 。 中國AI公司正在用事實證明 , 技術封鎖和空口指控無法阻擋國產AI的發展 。
蒸餾也能成“攻擊手段”?
蒸餾技術本無罪 , 問題在于誰在用、怎么用 。
模型蒸餾是AI領域的標準訓練技術 , 通過讓大模型指導小模型學習 , 實現知識遷移和模型壓縮 。 例如 , DeepSeek在金融場景實踐中將175B參數模型壓縮至7B , 推理成本降低98%的同時保持了95%以上核心指標;MiniMax的M2.5模型在SWE-bench Verified上達到80.2% , 與Claude Opus 4.6的80.8%幾乎持平 , 但成本僅為后者的1/20 。
當前 , 蒸餾技術被全球AI公司普遍使用 , 包括OpenAI、谷歌、Meta等巨頭都在自家模型上應用 。 事實上 , 就連Anthropic自己也在指控三家中國公司后 , 補充了一句“蒸餾法是合理的:人工智能實驗室利用蒸餾為客戶創建更小、更便宜的模型 。 ”只不過 , 后面又跟上了一句“一些境外實驗室非法提煉美國模型后 , 可移除其安全防護機制 , 將模型技術能力應用于本國的軍事、情報及監控系統中 。 ”
可以發現 , Anthropic的邏輯是:蒸餾本身無罪 , 但當中國公司使用時 , 就成了“非法竊取” 。
Anthropic聲稱 , 通過IP地址、請求元數據等信息將“攻擊”追溯到了具體實驗室 , 甚至以“與員工公開資料匹配”為由指向中國公司 。 但目前 , 這些指控僅為Anthropic的“一面之詞” 。
有聲音認為 , 這樣的溯源方式在法律層面難以成立 , 蒸餾技術遷移的是功能邏輯而非直接復制數據 , 更貼近法律允許的“反向工程”范疇 。 簡單扣上“盜竊”帽子 , 并不能掩蓋證據薄弱的事實 。
這種指控也讓人感覺是“賊喊捉賊” 。 Anthropic本身有過“竊取數據”的“黑歷史”:2025年9月 , Anthropic 因大規模從LibGen、PiLiMi等盜版網站非法下載超700萬本受版權保護的圖書 , 并使用這些盜版書籍訓練AI模型 , 被迫向以作家安德里亞?巴茨(Andrea Bartz)為首的全球作家集體支付了15億美元和解金 。 正如馬斯克所說 , “這是不爭的事實 。 ”
當前 , AI行業尚處于規則空白期 , 蒸餾技術的邊界在哪里、數據使用的底線是什么 , 需要全球共同制定標準 。 商業競爭無可厚非 , 但動輒扣帽子、搞雙重標準 , 只會阻礙技術創新與普惠 。 當OpenAI、谷歌、Anthropic自己都在大規模使用未經許可的數據訓練模型時 , 他們對“蒸餾”的指控 , 更像是維護既得利益的防御性反應 。
不懼指責 , 中國AI模型奮起直追
對于Anthropic的單方面指責 , 月之暗面和MiniMax均未予以回應 , 其用意很明顯:用數據和事實說話 。
DeepSeek自2026年以來發表了多篇論文 , 并一以貫之地開源其最新研究成果 , 將“降本增效”貫徹到底 。 同時 , DeepSeek也正在對新模型進行灰度測試 , V4“呼之欲出” 。
月之暗面方面向貝殼財經記者透露 , 在完成上一輪5億美元融資僅一個多月后 , 其將完成新一輪超7億美元的融資并再次超募 , 本輪由阿里、騰訊、五源、九安等聯合領投 。 新一輪100億—120億美元估值的融資已經開啟 , 并已收到多家機構意向 。 連續兩輪超12億美元的融資 , 創下近一年來大模型行業的最高融資紀錄 。
此前字節估值突破百億美元大關用時超4年 , 拼多多用時超3年 , Kimi僅用兩年多的時間就實現估值30多倍的增長 。 照此看來 , Kimi有望創下國內公司從成立到估值超100億美元的最快成長速度 。
而在模型的調用量方面 , 月之暗面旗下的Kimi K2.5大模型發布不到一個月 , 其近20天累計收入已超過2025年全年總收入 。 根據OpenRouter , Kimi K2.5的調用量在OpenClaw的模型調用榜中排名第一 。
MiniMax方面則向貝殼財經記者披露 , 春節前夕MiniMax 開源新一代模型 M2.5 , 發布12小時內登頂OpenRouter熱度榜 , 一周內登頂調用量榜首 , 周調用量暴漲至3.07T tokens 。 OpenRouter 整體調用量也在同步攀升 。 官方隨后確認 , M2.5 帶動了100K至1M 長文本區間的增量調用需求 , 而這個區間正是Agent工作流的典型消耗場景 。
【Anthropic指控三家中國模型“非法蒸餾” 馬斯克:賊喊捉賊】事實上 , 中國AI公司的快速進步 , 源于龐大的工程師群體、豐富的數據資源、完善的產業鏈 , 以及對開源開放路線的堅持 。 DeepSeek、Kimi、MiniMax在編程、多模態、Agent等領域的突破 , 是技術創新與場景深化的結果 。
新京報貝殼財經記者 羅亦丹
編輯 岳彩周
校對 柳寶慶

    推薦閱讀