印奇掛帥階躍星辰:大模型「季后賽」進入物理世界

印奇掛帥階躍星辰:大模型「季后賽」進入物理世界

文章圖片

印奇掛帥階躍星辰:大模型「季后賽」進入物理世界

文章圖片

印奇掛帥階躍星辰:大模型「季后賽」進入物理世界

文章圖片


APPSO 獲悉 , 階躍星辰近日完成了超 50 億元人民幣 B+ 輪融資 , 參與機構包括上國投先導基金、國壽股權、浦東創投、徐匯資本、無錫梁溪基金、廈門國貿、華勤技術等產業投資方 。 騰訊、啟明創投、五源資本等老股東進一步跟投 。
值得注意的是 , 這筆融資超過了月之暗面前不久宣布的 5 億美元 C 輪 , 刷新了過去 12 個月中國大模型賽道單筆融資的最高紀錄 , 甚至超過了智譜和 MiniMax 兩家公司 IPO 的募資額 。
最近一個月以來 AI 資本新聞此起彼伏:Manus 被 Meta 收購 , 月之暗面楊植麟高調表示「不缺錢」 , 智譜和 MiniMax 先后在港敲鐘「上岸」 。 今天 , 階躍這筆融資 , 再次攪動了 AI 賽道躁動的神經 。
對比之下 , 階躍前往的方向略有不同:當其他大模型玩家追尋確定性、抓住窗口期 IPO 上岸的同時 , 階躍星辰拿著這筆重金 。 選擇了一條更重、更慢的路:物理世界 。
路線沒有對錯 , 但業內的判斷已經成為共識:大模型競爭的常規賽已經結束 。 過去兩年比拼的是參數量和 token——但從 2026 年開始 , 季后賽將圍繞新的核心命題展開:
人工智能如何走出數據中心 , 進入真實世界 , 接管更多的物理終端 。
越周期的人與公司
APPSO 認為 , 在融資之外 , 更值得關注的是人事變動 。
一位來自「上一個 AI 周期」的關鍵人物 , 正式走到了臺前:千里科技董事長印奇 。
印奇早已深度參與階躍星辰的戰略規劃 , 此次也獲得了一個新身份:階躍星辰董事長 , 全面負責公司戰略與產業落地 , 與現有團隊形成正和互補 。
在此之前 , 階躍團隊配置的特點是技術能力強 , 產業經驗稍弱:
CEO 姜大昕是前微軟全球副總裁和微軟亞洲互聯網工程院首席科學家 , 負責過必應搜索的研發 , 這意味著他不僅懂技術 , 也有將 AI 產品化落地到全球級大流量產品的經驗 , 去年他成為了唯一來自中國大模型初創公司的 IEEE Fellow; 首席科學家張祥雨是深度學習領域基石論文 ResNet 的四位作者之一 , 對業界貢獻不言而喻; CTO 朱亦博曾任 Google Cloud GPU 產品技術負責人 , 直接支持 Anthropic , 更早之前在字節負責 AI Infra 建設 , 是國內少數有萬卡集群從零構建實戰經驗的工程師 。這支團隊用兩年的時間殺出了「百模大戰」 , 躋身中國大模型第一梯隊 。 今天的階躍 , 是國內少數幾家仍在堅持預訓練、探索基座模型更高智能上限的初創公司 , 且擁有類型最全的模型矩陣 。
但技術領先不等于商業成功 。 當大模型競爭更加白熱化的下半場 , 模型性能已經無法成為市場偏愛的唯一理由 。 如何讓大模型進入真實應用場景、產生商業價值 , 成為新的分水嶺 。
一家公司想要穿越周期 , 需要懂得如何穿越周期的人 。 印奇正是階躍需要的那塊拼圖 。
10 多年前「深度神經網絡」還是熱詞 , 研究者們首次意識到自己的研究和能力對于業界的巨大效用 。 2011 年 , 印奇和幾位清華姚班同學共同創辦曠視科技 。
在中國 AI 創業者中 , 印奇是少有的「兩棲物種」 。 與月暗、智譜等純粹的學術派創始人 , 以及梁文鋒等量化背景創始人不同 , 印奇最大的標簽是「落地經驗/能力」 。 曠視 IoT 業務服務國內超 100 座城市 , 業務拓展至全球十多個國家地區 , AIoT 平臺終端接入規模達到億級 。
印奇
印奇的名字近幾年不常被 AI 圈人士提起 , 但確實沒多少人比他更懂 AI 下一個周期的核心敘事:
大模型不止于學術論文和榜單排名 , 它必須進入物理世界 , 形成閉環 。
這也解釋了階躍 all in 拓展模型邊界之外的另一條主線:推動大模型進入手機、汽車等消費終端 。 數據顯示 , 階躍已與中國六成頭部智能手機品牌深度合作 , 模型裝機量突破 4200 萬臺 , 覆蓋 OPPO、榮耀、中興等品牌 , 日均服務 2000 萬人次 。
在汽車領域 , 階躍與千里科技、吉利達成深度合作 , 將端到端語音模型集成到 AgentOS 智能座艙中 。 吉利銀河 M9 上市 3 個月銷量接近 4 萬輛;按照階躍的規劃 , 其車載模型今年的裝車量目標在百萬輛級別 。
印奇在階躍草創階段就深度參與公司的戰略規劃 , 陪跑至今 。 如今印奇的正式加入 , 意味著他本人長期布局的「AI+終端」戰略 , 通過階躍得以加速 , 進入全面執行階段 。
其本人旗下業務的組合 , 難免令人聯想到 Elon Musk 的 xAI 和特斯拉/Optimus 組合:一個提供靈魂 , 一個構成身體 。

聚焦多模態:進入物理世界的唯一門票為什么「AI+終端」必須押注多模態?
從純技術維度來看 , 多模態能力是大模型進入物理世界的「感官系統」 。 如果大模型是一個智能體 , 文本只是符號邏輯 , 多模態才真正構成眼睛、耳朵和嘴巴 。 只有具備多模態能力 , AI 才能真正感知并融入人類的真實生活 。
進一步看 , 實現這種感知能力有兩條路徑:一條是行業主流的「外掛」模式 , 即先進行視覺編碼 , 再交給語言模型理解 。 這種方式雖然簡單 , 但就像給盲人配個解說員 , 信息在轉化中必然發生損耗、延遲 。
而階躍堅持的是「原生多模態」路線 , 直接從圖文交錯語料出發 , 進行端到端訓練 。 這種模式不受拼接架構的局限 , 實現了更原生、自然的多模態理解和生成 , 讓 AI 能夠模仿人類的方式 , 去理解物理世界的因果邏輯 。
除了視覺之外 , 這種「原生性」在階躍的音頻模型上同樣有所體現 。 比如 , 最新的 Step-Audio-R1.1 通過 MGRD(模態錨定推理蒸餾)技術 , 讓模型生成純粹基于升學特征的推理鏈 , 解決了音頻模型「思考越多錯越多」的問題 , 生成效果在權威榜單 Artificial Analysis 上取得全球第一的成績 。
目前階躍已經將第二代音頻大模型裝車 , 當你在車內說「我有點冷」 , 傳統智能座艙將語音轉文字 , 識別關鍵詞 , 再執行預設指令;而新一代座艙能結合語調、情感、環境噪音等信息 , 推測用戶的真實需求 , 而非簡單的關鍵詞匹配——比如 , 當你開著車門說冷 , 可能只需要關上車門就好 。 這種對原生多模態的堅持 , 并非跟風 。 早在 2023 年成立之初 , 階躍就確定了語言大模型與多模態大模型同步研發的并行戰略 。 這條道路沒有捷徑的 , 而階躍的選擇也為今天「AI+終端」的爆發埋下了伏筆 。
從理解世界到主動交互原生多模態是為了讓大模型「理解世界」 , 而走向物理世界的下一步需要大模型學會「與世界交互」 。
于是階躍在 VLA(視覺-語言-動作)架構上深耕至今 。 其意義在于 , 讓 AI 能看、能聽 , 更能像人一樣 , 在數字或物理環境中具備決策與執行能力 。
為了實現這一理念 , 階躍推出了業內首款可真正部署的開源 GUI 系列模型 Step-GUI 。 其中 , 40 億參數量的端側版本 Step-GUI-Edge 展現出極強的「以小搏大」能力 , 在主流基準測試中甚至能夠超越 8 倍于其參數規模的模型 。 這意味著即便在消費級終端的算力受限情況下 , 大模型也能從容處身其中 , 變身為具備讀屏和代操作能力的智能 agent 。 這也意味著所有手機廠商都能基于這套能力 , 開發類似于豆包手機助手的功能 。
這種從感知到動作的進化 , 已在大規模商業落地中得到了認證 。 在手機終端上 , 階躍被認為是最懂 AI 手機的大模型廠商 。 據 APPSO 了解 , 目前階躍已于已于國內 60% 頭部手機品牌達成深度合作 , 覆蓋 OPPO、榮耀、中興等品牌旗艦機型 。
今天 , 市售手機的 AI 功能早已超出了去年「對話框」的范疇 , 開始深入到系統層面 , 比如 OPPO 的「一鍵問屏」、榮耀的「拍照問」、中興的「長輩 AI 助手」等功能——大模型不僅能看懂屏幕、生成內容 , 還能跨應用完成復雜任務 。
IDC 數據顯示 , 2026 年中國市場 AI 手機滲透率將突破 50% , 每兩臺中就有一臺具備系統級的原生 AI 能力 。
對于「大模型競賽進入下一階段」的業界共識 , 印奇和階躍押注了一條更難但更具確定性的路:AI 必須嵌入物理世界的骨架才能長久生存 。
在硅谷的平行世界中 , 馬斯克整合 xAI 和特斯拉/Optimus , 構建從前沿模型到物理終端的完整閉環 。 這條路需要重資產、重經營 , 也需要大多數模型公司不具備的產業資源 。 但在穿越過周期的人看來 , 這會是通往 AGI 的正解 。
階躍不必擁有所有的工廠 , 但必須深度在場 。
#歡迎關注愛范兒官方微信公眾號:愛范兒(微信號:ifanr) , 更多精彩內容第一時間為您奉上 。
【印奇掛帥階躍星辰:大模型「季后賽」進入物理世界】愛范兒|原文鏈接· ·新浪微博

    推薦閱讀