趨境ATaaS平臺發布,打造日均萬億產能的“Token工廠

趨境ATaaS平臺發布,打造日均萬億產能的“Token工廠

文章圖片

趨境ATaaS平臺發布,打造日均萬億產能的“Token工廠

文章圖片

趨境ATaaS平臺發布,打造日均萬億產能的“Token工廠

3月27日 , 作為2026中關村論壇核心組成部分 , 由趨境科技與九源智能計算系統生態聯合體共同主辦的“全棧智能 全域推理:Token爆發元年的全場景大規模推理服務”專題研討會成功舉辦 。 論壇匯聚院士、頂尖學者及產業領軍人物 , 聚焦大模型時代推理服務的核心技術、產業實踐和生態協同 , 共探高效、穩定、安全、普惠的大模型推理服務體系建設 。

活動特邀九源智能計算生態聯合體秘書長、清華大學教授、趨境科技首席科學家武永衛擔任主持人 。 啟元實驗室副主任劉航、工業和信息化部電子工業標準化研究院副院長郭楠為活動致辭 。 中國工程院院士、九源智能計算系統生態聯合體理事長、清華大學教授、趨境科技首席科學顧問鄭緯民受邀出席并做主旨演講 , 從宏觀視角解讀了從“模型服務”邁向“Token服務”的底層邏輯與基礎設施變革 。 趨境科技創始人兼CEO艾智遠現場發布全新一代AI推理平臺——趨境 ATaaS 高效能 AI Token 生產服務平臺(Approaching.AI Token as a Service) , 為破解算力投入與Token產出失衡難題提供了系統性解決方案 。 眾多等產業鏈領軍企業代表現場帶來主旨演講 , 分享AI推理服務產業的發展新路徑 。
鄭緯民院士:AI產業核心已從模型服務轉向Token服務
鄭緯民院士在題為《從模型服務到Token服務》的主旨演講中指出 , 隨著智能體、AI Coding等應用的爆發式增長 , Token消耗量呈百倍、千倍級躍升 , 2026年已成為名副其實的“Token爆發元年” 。 AI產業的核心關注焦點 , 正從“模型參數規模、模型可用性”全面轉向“穩定、低成本、高質量交付的Token產能” 。

“未來的智能基礎設施應圍繞‘Token即服務(TaaS , Token as a Service)’進行重構” 。 鄭緯民院士表示 , 傳統模型服務的核心是保障模型可得性與接口完整性 , 而Token服務的核心是保障Token產能的可用性 , 更關注成本、吞吐、延遲與可靠性等生產性指標 , 是一個極端復雜的多維系統最優化問題 , 必須完成全鏈路的系統級創新 。
對此 , 鄭緯民院士明確了TaaS發展的三大核心技術底座:一是全系統異構協同 , 通過將不同計算任務合理分配至GPU、CPU、內存和SSD , 打破算力瓶頸;二是存算協同實現“以存換算” , 通過前置KV Cache等技術 , 大幅降低重復計算量 , 提升推理效率;三是面向SLO的智能調度 , 精準地將用戶業務需求“翻譯”為底層資源決策 。 鄭院士表示:“只有讓智能生成像水電一樣被穩定地調度與供給 , 才能真正迎來算力制造Token為王的普惠智能時代 。 ”

【趨境ATaaS平臺發布,打造日均萬億產能的“Token工廠】趨境ATaaS平臺重磅發布 , 打造全球領先的Token生產效能放大器
趨境科技在論壇上重磅發布了其核心產品——趨境ATaaS高效能AI Token生產服務平臺 。 本次發布由趨境科技創始人兼CEO艾智遠 , 與中國工程院院士、九源智能計算生態聯合體理事長、清華大學教授、趨境科技首席科學家鄭緯民 , 以及并行科技董事長陳健、中科曙光智能計算產品事業部總經理杜夏威、華為昇騰計算業務副總裁兼首席產品規劃師葉耀榮、京東Infra產品負責人郝鵬、浦江實驗室代表鐘普共同揭曉 。

針對當前大模型推理服務中普遍存在的硬件資源閑置、軟件適配滯后、算力配置粗放、架構演進失衡四大核心難題 , 該平臺將有效破解大額硬件投入難以轉化為優質 Token 產能、資源浪費與成本空耗突出的行業困境 , 以高效能Token生產為核心目標 , 可支撐萬級別AI推理需求 , 并達到日均萬億級別Token整體產能 。
趨境ATaaS平臺依托四大自研核心技術 , 構建覆蓋異構整合、智能調度、彈性擴容的全鏈路能力:
· 六合:異構推理2.0:全球首創大模型計算邏輯重構技術 , 深度融合CPU+GPU、國產與非國產算力 , 實現任務的智能分流 , 可將萬卡級智算集群運營成本壓降20%以上 。
· 月餅:以存換算2.0:全球首創超體量KV Cache緩存技術 , 將KV Cache存儲空間擴展百倍至千倍 , 緩存命中率最高可達90% , 直接削減90%的GPU算力開銷 。
· 雙儀:虛實同構:全球首創算子級SLO仿真技術 , 實現算力資源的智能預規劃與動態調優 , 可精準切分異構算力 , 將萬卡級智算集群硬件綜合資源利用率最高提升數倍 。
· 萬象:極致彈性:打通規?;慨a最后壁壘 , 支持萬億參數大模型7秒快速拉起與動態配置變更、數百節點超大規模EP彈性調度 , 為萬卡級高性能橫向擴展提供關鍵能力 。
趨境ATaaS平臺的發布為AI基礎設施的建設和運營提供了新的思路和行業標準 , 使每單位算力和能耗投入都能夠數倍轉化為更穩定、更可衡量的Token價值產出 , 更標志著AI基礎設施發展焦點從單純的算力規模競爭 , 轉向對 Token 生產效率的綜合衡量 , 推動算力基礎設施從“數據中心”向“Token工廠”全面演進 。


全產業鏈生態協同 , 凝聚國產算力發展核心共識
本次論壇不僅是技術的展示臺 , 更是產業生態協同的匯聚點 。 趨境科技積極推動與產業鏈上下游伙伴的深度合作 , 致力于構建開放共贏的智能計算生態 。 論壇上 , 來自并行科技、九源智能計算系統生態聯合體、中科曙光、京東云、阿里云、華為、商湯科技等企業的代表在論壇上圍繞國產算力多場景推理優化實踐、推理框架實踐、Token時代AI引擎、算力底座高效推理等前沿話題以及與趨境科技的深度合作展開深入分享 。
并行科技作為國內領先的算力服務商 , 在第三方算力服務領域位列第一 , 并行科技董事長陳健在演講中指出 , 其MaaS服務得到趨境科技的大力支持 , 雙方合作將高質量Token的生產成本大幅優化 , 并將特定場景下的集群性能提升50% , 共同為智譜、Kimi、MiniMax、DeepSeek等頭部大模型客戶提供優質服務 。
九源智能計算系統生態聯合體副秘書長王豪杰指出 , Token時代競爭轉向單位成本產出 , 國產卡面臨“生態驅動”困局 。 九源聯合體打造國產智能計算生態 , 已取得多項成果:全國產化方案適配多款GPU、串行代碼高效并行的九源領域編程語言“九齒”、支撐Mooncake推理加速系統、基于國產芯片的高效智能體 , 并與KTransformers等框架深度聯動 , 推動國產算力從“可用”邁向“好用” 。
京東云AI Infra產品負責人郝鵬表示 , 京東云已與趨境科技達成深度合作 , 聯合打造下一代推理引擎 , 共同賦能Mooncake開源生態 。 華為昇騰計算業務副總裁、首席產品規劃師葉耀榮強調 , 趨境與昇騰展開了全方位的技術和商業化合作 , 部分項目中在昇騰AI集群上實現了2倍以上性能提升 。 此外 , 阿里云政企事業部教育科研解決方案總監楊坤、商湯科技大裝置首席架構師項鐵堯等也分享了與趨境科技在Mooncake等開源項目上深度合作 , 以及為趨境Token服務提供高可靠算力支持的實踐 。
在圓桌對話環節 , 清華大學計算機系副教授章明星與中國移動數智化部副總經理陳國 , 天數智芯副總裁宋煜 , 中國科學技術大學計算機學院特任教授、博導李誠 , 美團首席工程師錢玉磊 , 趨境科技Mooncake首席工程師楊珂 , 圍繞“國產推理基礎設施從‘可用’到‘好用’的路線選擇與關鍵突破”展開探討 。 各方凝聚了三大共識:一是軟硬深度協同是釋放國產算力潛能的關鍵 , 需通過系統級優化彌合硬件性能與業務需求之間的鴻溝;二是生態統一與標準建設至關重要 , 打破“百花齊放”帶來的適配難題 , 才能實現規模化應用;三是人才培養是產業根基 , 需通過開源社區、技術競賽等方式 , 培育兼具理論與工程能力的AI Infra人才 。

本次研討會的成功舉辦 , 恰逢AI產業從模型競爭轉向規?;瘧?、從MaaS轉向TaaS的關鍵節點 , 不僅為AI推理服務領域搭建了產學研用深度交流的平臺 , 更為AI產業高質量發展謀劃路徑 。 論壇同期宣布2026年春季啟元人工智能大賽正式啟動 , 旨在通過賽教融合 , 為國產智能計算生態培育新一代人才 , 持續推動AI產業的開源創新與規模化應用 。
轉載來源:趨境科技
本文為量子位獲授權轉載 , 觀點僅為原作者所有 。

    推薦閱讀