楊植麟摸著DeepSeek過河

楊植麟摸著DeepSeek過河

文章圖片

楊植麟摸著DeepSeek過河

文章圖片


文|鄧詠儀
編輯|蘇建勛
發布開源模型K2一周后 , Kimi引起的全球熱潮還在繼續 。
7月11日 , 月之暗面(Moonshot AI)開源了萬億參數的MoE模型Kimi K2 。 這是一個參數高達1T , 激活參數32B的MoE模型 , 包括兩款開源模型版本Kimi-Base和Kimi-instruct 。
K2是個“偏科”選手 , 擅長編程、智能體類的任務 。 在Kimi公布的測評結果中 , Kimi K2在自主編程、工具調用和數學推理三個維度的表現上 , 都超過了同為開源模型的DeepSeek-V3和阿里Qwen3 。
△圖源:Kimi
Hugging Face數據顯示 , 開源一周后 , K2下載量累計超過10萬 , 還在快速攀升中 。 在大模型權威競技場LMSYS中 , K2-Instruct已經沖到總榜第四 , 僅次于GPT-4o、Claude-3.5、Gemini-1.5-Pro 。
馬斯克在推特上轉發了的OpenRouter趨勢數據顯示 , K2的在一周內攀升至全球趨勢榜第二 , 僅次于Grok 4 。
△圖源:Twitter
月之暗面這次沒有選擇大規模營銷 , 而是在用一種全新的方式開源 。
K2發布后 , Kimi的算法工程師、研究員 , 在推特、小紅書、知乎上積極分享K2的工作和技術 , 回復用戶疑問;Kimi的官方推特也在不間斷地刷屏 , 轉發社區里對K2的贊美和建議 。
熱情的互動引來了更多的“自來水” 。 Hugging Face聯合創始人Thomas Wolf就對Kimi K2大加贊賞 , 表示開源模型正在挑戰最新的閉源權重模型 。
發布熱鬧得像團建 , 與這家公司過去半年的沉默形成鮮明對比 。
過去兩年 , Kimi經歷了一場過山車般的起伏:幾乎是最后一個推出ChatBot助手Kimi , 但是憑借著長文本和出圈的策劃一炮而紅 , 成為最先出圈的大模型應用產品 。
但2025年 , 幾乎所有模型廠商 , 都被橫空出世的DeepSeek打得失語 。 追逐AGI , 證明自己還有技術實力 , 變成了所有廠商要做的證明題 。
曾經擁有夢幻開端的Kimi , 在今年來了個猛轉彎:To C的Kimi應用停止投流 , 專心主攻模型 。 去年曾經試水的Ohai、Noisee等其他C端應用 , 以及Kimi在多模態上的嘗試也迅速暫停 。 這也讓它遭受的質疑更猛烈——是不是放棄了預訓練?停止投流后 , To C應用放棄了嗎?
蟄伏半年 , Kimi需要一場翻身仗 。 K2的發布 , 就是回歸AGI主線的一種宣言 。

“又一個DeepSeek時刻”K2發布 , 已經引起了全球開發者社區的震動 。 7月16日 , 著名的《Nature》雜志發文 , 表示K2的發布為“另一個DeepSeek時刻” , 足見其贊美 。
為什么K2的發布如此重要?簡單來說 , 因為K2把DeepSeek模式再走了一遍:主打高性能、低成本 , 而且真開源 。 最重要的是 , 端出了真的好東西 。
K2是個性能強悍的模型 。 它很專注 , 目標清晰——就是為了智能體(Agentic AI)而生 。
一位Kimi的算法工程師Justin Wong在博客里說:Kimi希望把人與AI的交互方式 , 從chat-first變成artifact-first , 即交付一個具體的交付物(比如一個3D模型、一個表格) , 而非交付一段聊天上下文 。
用大白話說 , 就是要真能干活 , 不只是純聊天了 。
了解了這點 , 才能理解Kimi在模型訓練路線上的諸多選擇 。
DeepSeek R1發布時 , 更多注重思考、推理能力 , 在發布后相當長一段時間才加入工具調用功能 。 而K2并沒有像DeepSeek R1那樣帶上推理模式(如展現思考過程) , 雖然也著重提升了風格化寫作能力 , 但并沒有過多強調 。
K2最看重的還是Agentic(智能體)能力 , 把提升“自主使用工具、完成任務”的能力 , 放到最高優先級 。 “這在整個領域里是一個非常罕見的選擇 。 ”一位從業者評論道 。
更具體地說 , K2把優化的重點放在了:根據聊天的上下文 , 調用外部的工具 , 要讓調用速度更快 , 完成任務的質量更高——比如瀏覽器、PPT、Excel、3D繪畫軟件等等 。 用戶也可以接入owl、Cline、RooCode 等 Agent/Coding 框架 , 來自主編程 。
所以 , 在K2的使用案例中 , 你可以看到 , 直接輸入Prompt , 不用怎么等K2“思考” , K2就迅速生成3D旋轉地球模型、生成PPT、生成晝夜循環的山川峽谷3D景觀、3D粒子星系、交易看盤等等 。
△Prompt: Create a 3D HTML mountain scene with cliffs rivers and day-night lighting. Supports drag/zoom animated transitions realistic gradients and toggleable contour lines... (創建一個 3D HTML 山脈場景 , 包含懸崖、河流和晝夜光照變化 。 支持拖動和縮放、動畫過渡、真實感漸變色 , 并可切換等高線顯示...) 來源:Kimi
把13萬行的原始數據丟給 Kimi K2 , 可以幫你分析遠程辦公比例對薪資的影響 , 分析顯著差異 , 自動生成統計圖表與回歸模型解讀等等 , 用統一色調做出小提琴圖(violin plot) 、箱線圖(box plot)、散點圖(scatter plot)等專業圖表 , 整理成報告 。
△來源:Kimi
K2的另一個核心貢獻在于 , 把模型的訓練和使用成本又拉到了一個地板價 , 同時還保持著接近Claude主流模型的性能 , 主打一個性價比高 。
Kimi K2 API的定價是:每百萬輸入tokens 4元 , 每百萬輸出tokens 16元;直接和同樣主打編程的Claude 4 Sonnet(每百萬輸入3美元 , 每百萬輸出15美元)的API價格相比 , 整體成本可以下降超過75% 。
別小看這75% , 如今AI編程已經成為創業賽道的“明牌” , 賽道里包括Cursor等頭部AI編程公司估值已經迅速起飛 。 截至2025年6月 , Cursor的ARR(年度經常性收入)已突破5億美元大關 , 相較于4月中旬披露的3億美元 , 短短兩個月內飆升了60% 。
開發者會實實在在用腳投票 。 K2一出 , Hugging Face的下載量漲得飛快 , K2很快就登上了OpenRouter的趨勢榜周第二 , 開發者頻頻吐槽為什么API還這么慢 , 用不上 。
K2現在并不完美 , 輸出的結果還是會有不足之處 , 比如Token輸出比較啰嗦 , 代碼質量和頂尖的Claude相比還是有差距——但架不住它性價比高 。 很多博主的測試案例中 , 普通程序員寫一天代碼也就幾塊錢 , 大大降低了AI編程的算力使用門檻 。
性價比高 , 也源于Kimi一些原創性的創新 。
Kimi從訓練階段引入了新的優化器Muon , 取代了原來主流的AdamW優化器 , 在不同Llama架構模型上 , Muon的算力需求只有AdamW的52% 。
優化器是大模型里的一個核心組件 , 決定著在訓練時的模型參數如何調整 。 優化器優化得越好 , 模型在同樣的硬件環境下跑得更快、更穩 , 換種角度說 , 也更節省了算力 。
這可以說是一場技術冒險 。 Muon原本是一個比較前沿的優化器方向 , 甚至沒有發表正式論文 , 以前只在小型模型上訓練成功過 。 但Kimi選擇將Muon擴大到萬億參數去嘗試 , 并且解決了大規模訓練下的很多技術難點 , 讓Muon成為這次K2發布最受尊重的工作之一 。
在公司門口放鋼琴、公司名字用傳奇搖滾專輯命名 , 這看起來是很朋克 。 但在巨大的市場壓力下 , 專注在一個方向 , 把一個新技術架構直接上到萬億參數去訓練 , 用真金白銀去試 , 還成功了 。
這才是真的朋克 。

六小龍沒有回頭路從K2發布的細節看 , DeepSeek在全球造成的影響仍在持續 。
今年1月發布的DeepSeek R1是全球AI敘事的分水嶺 。 在那之前 , 國內無論是大廠 , 還是AI初創 , 大家都在卷AI應用 , 搶奪用戶和留存 。
Kimi曾經在2024年做過一波激進投流 , 和字節的豆包對打 。 但投流、增長是在大廠舒適區里的事情 , Kimi很快就顯得力不從心 。 2024年11月 , 豆包宣布MAU過億 , 在國內一時風頭無兩 。
很快 , 這些成果都被DeepSeek R1迅速超越 。
DeepSeek之后 , 無論是大廠還是初創 , 大家都形成共識:追求模型能力提升才是最重要的事 。 國內To C應用的戰場上 , 幾乎就剩下元寶、夸克和豆包在廝殺 。
如今商業化已經是個有點遙遠 , 且不是最重要的問題了 。 面對在模型和應用上都在All in的大廠 , 留給大模型初創的路幾乎只有一條:開源 , 和攻克最難的問題 。
【楊植麟摸著DeepSeek過河】前不久的36氪Waves大會上 , 真格基金合伙人戴雨森在談到Kimi與Minimax時曾說: “一年前 , 大家比投放、比用戶 , 比投放 , 其實是大廠的機會 。 現在則回到技術前沿 , 回到強認知 , 我相信反而更適合以技術大牛為核心的創業團隊 ?!?br /> 六小龍們都做出了自己的選擇 。 DeepSeek R1的沖擊后 , 各家呈上的答卷 , 實則表明了一種路線的分野:Kimi已經有點像Anthropic , 主打提升編程、智能體的能力;Minimax和階躍牢牢抓緊多模態;智譜則是走更本土、To B/To G的路線;百川選擇繼續做醫療模型;01早已宣布不再做超大基礎模型迭代 , 轉而專注在大模型落地上 。
此前 , Kimi在海外知名度有限 , 但K2的爆火已經帶來實在的回報:全球開發者圈子里開始關注起Kimi , 有人開始研究CEO楊植麟的過往經歷 。 開發者們喜歡這個充滿朋克文化的團隊——Kimi團隊成員在小紅書、推特展示公司里以傳奇樂隊命名的會議室 , 也會在Twitter坦承“現在K2還不完美 , infra還有很多不足 , 正在加班加點修復 。 ”
△來源:Twitter
而更早之前 , 在Kimi專注提升模型能力 , 推出包括深度研究等產品后 , 其實也反哺到了產品上:Kimi的Web端數據從6月開始反彈 , 訪問量環比增長30% 。
某種程度上 , 開源和朋克有著同樣的精神內核 , 自由、開放、尊重技術 , 這是現在AI圈子里最強勢的\"注意力貨幣\" , 不僅能建立名聲、展現信仰 , 還有招攬人才——這才是AI初創現在最著急的事 。
K2發布后 , 一位Kimi研究員曾經在博客里提到:“ 2025年 , 智能的上限仍然完全由模型決定 , 作為一家以AGI為目標的公司 , 如果不去追求智能的上限 , 那我一天也不會多呆下去 。 ”
追求AGI看似是一條窄路 , 對還在這條路上的初創公司而言 , 還是一條康莊大道 。
只要足夠專注 。
封面來源|視覺中國
歡迎交流

    推薦閱讀