騰訊云智算全面升級,AI原生云基礎設施邁向主動服務新時代

騰訊云智算全面升級,AI原生云基礎設施邁向主動服務新時代

文章圖片


9月17日 , 騰訊全球數字生態大會Agent + Infra專場聚焦“智能體驅動云基礎設施躍進升級”這一主題 , 匯聚眾多行業領軍者 , 共同探索AI時代基礎設施的技術突破與產業實踐 。 騰訊云智算各產品負責人及行業客戶深入解讀AI原生云架構、主動服務型基礎設施、全鏈路安全體系等核心議題 , 同時發布多項重磅成果 , 為智能體規模化落地筑牢技術底座 。
在論壇中 , 騰訊云副總裁李力正式宣布 , 騰訊云智算面向“更貼近Agent的AI Infra”重磅升級 。 騰訊云建立包括Agent Infra解決方案+Cloud Mate云專家服務智能體與全鏈路安全能力為一體的完整解決方案 , 幫助 Agentic AI 從“實驗室”走向“生產級” 。

【騰訊云智算全面升級,AI原生云基礎設施邁向主動服務新時代】李力表示 , 未來兩年 , 部署Agent的企業將翻倍 , GenAI相關的IaaS支出增速將達到192% 。 隨著Agent數量爆發式增長 , 企業對云計算基礎設施的需求 , 將會快速從“資源供給”升級為“業務價值” , AI Infra基礎設施必須具備更快的推理效率、更靈活的工具集成、更可靠的系統保障和更自動化的服務能力 。 騰訊云智算體系核心優勢在于 “同源同構” , 無需打造 AI 專屬存儲等設施 , 依托過往打磨的云原生能力 , 即可承接智算需求 , 實現云與智算能力的深度協同 。 目前 , 騰訊云智算已實現“一云多芯”軟硬協同 , 支持公有云、專有云、邊緣環境的同源同構部署 , 為交通、制造、具身智能等行業提供從模型訓練到推理落地的全鏈路支撐 。

圖:騰訊云智算能力升級 , 成為更貼近Agent的AI原生云在AI Infra底座層面 , 騰訊云智算基于在云計算、分布式存儲、高性能網絡等基礎設施方面的深厚積累和場景優化 , 大幅提升云上資源的性能和利用率 , 最終實現降本增效 。 模型啟動提速17倍 , 大規模服務擴容時間從10分鐘縮短至34秒;多模態推理加速4倍 , 自研推理引擎覆蓋生文、生圖、生視頻等模型;通過內存優化與通訊協議升級等創新 , 顯著降低計算開銷 , 推動推理集群的性能發揮到極致 。
智能體要從“實驗室”走向“生產級” , 工程問題和安全問題將成為核心痛點 。 全新發布Agent infra解決方案Agent Runtime , 集成運行引擎、云沙箱、上下文服務、網關、安全可觀測五大組件 , 為智能體提供堅實基礎設施 , 其中云沙箱實現毫秒級啟動 , 數十萬實例秒并發 。
全新發布的Cloud Mate云專家服務智能體 , 將專家經驗轉化為自動化服務 , 利用Agent的自動化編排能力 , 在云上架構治理、風險SQL攔截、故障定位等場景大幅提升效率 , 打造能主動服務的云 。 目前已為客戶提供超百萬次智能架構治理服務 , 在內部實踐中 , 風險SQL攔截率95% , 排障效率從30小時降低至最快3分鐘 。
在安全層面 , 騰訊云通過一整套大模型與智能體安全治理框架 , 為云上客戶提供安全、可控、可靠、滿足監管要求的安全建設思路 。 方案貫穿模型選型、模型訓練、推理部署、業務應用全流程 , 實現邊界API與用戶輸入/輸出安全、模型運行環境安全防護及態勢管理、智能體與MCP身份和特權防護、智能體行為與意圖安全管控、數據安全全流程安全等 。
此外 , 李力還分享了從數字世界到現實世界的思考 。 機器人是AI影響現實世界的一個關鍵形態 , 但具身智能與大語言模型存在顯著數據差異:一方面是具身的數據采集難度比較大 , 包括視覺、環境、關節角狀態等數據均要采集;另一方面 , 采集的數據與硬件高度綁定 , 進一步增加了數據采集的門檻 。 因此 , 騰訊云希望能夠幫助客戶跳過數采、訓練環節、直接提供支持跨本體直接使用的具身模型非常重要 。 騰訊云智算聯合Tairos(鈦螺絲)提供了感知和規劃模型服務 , 通過HAI推理集群獲取專屬的機器人云上大腦 。
Agent + Infra專場上 , IDC與騰訊云聯合發布了《AI Infra:加速智能體落地的基礎架構、發展趨勢與產業實踐》報告 。 報告深度剖析生成式AI(Gen AI)規模化落地背景下 , AI Infra(AI云基礎設施)從基礎算力平臺向核心智算基礎設施的演進路徑 , 系統梳理其技術架構、核心能力與行業適配方案 。 報告納入了地平線、貨拉拉、一汽豐田、燧原科技、作業幫、考試寶、心言集團、尚航科技、元石科技、智診科技、德適生物等標桿企業 , 覆蓋交通出行、工業制造、教育培訓、泛互聯網、具身智能、智慧醫療等六大重點行業 , 為企業智能化轉型提供“技術-場景-價值”三位一體的行動指南 。
在專場中 , 騰訊云多家客戶及伙伴參會 , 作業幫、帕西尼感知科技、智診科技、燧原科技等各行業代表企業 , 共同圍繞AI時代基礎設施的技術突破與產業實踐進行深入分享 。
作業幫針對教育場景算力供需的矛盾 , 搭建統一算力網絡 , 通過Docker+K8s容器調度、跨區域云聯網、GPU共享(qGPU)、在離線混部等策略 , 解決算力不足難題 , 節省算力成本 。 通過騰訊云COS優化模型分發 , 全鏈路耗時從6小時縮至45分鐘 。 同時 , 借助Agent、MCP協議與向量數據庫 , 將基礎服務接入效率提升10倍 , 構建起教育行業AI與基礎設施協同的高效范式 。
帕西尼通過帶有稀缺觸覺模態的億級全模態具身智能數據 , 助力AI理解現實物理世界 。 依托全球首座全模態超級數據采集工廠 , 年產能近2億條全模態數據 , 構建包含觸覺模態在內的高質量OmniSharing DB數據集 , 支撐具身智能大模型OmniVTLA研發 。 借助騰訊云Data Platform 解決方案實現億級全模態數據的存儲和管理 , 海量數據通過遷移服務統一采集進入對象存儲 COS , GooseFS 提升數據讀寫性能 , 加速模型訓練效率 , 讓數據自由流轉;依托騰訊云算力對全模態數據深加工 , 可重定向至不同機器人本體;騰訊云TAIROS具身智能開放平臺提供完整工具鏈 , 將仿真、云服務與前沿具身智能模型快速對接數據和本體 , 推動全模態數據集 OmniSharing DB賦能具身智能快速落地 。
智診科技 , 希望基于海量的算力、極致的通信效率和海量數據的高速讀取 , 訓練一個能實現“主動式關懷”的醫療大模型 , 破解醫療成本/醫療效果/醫療可及性這一全球醫療健康的“不可能三角” 。 其自主研發的千億參數多模態大模型WiseDiag-Z1 , 通過騰訊云穩定高效彈性的訓推集群、星脈網絡(為GPU集群鋪設無擁堵超級高速路)、CFS Turbo(為數據供給打造數據倉庫) , 學習超3萬億專業醫療tokens(含19萬篇論文、50萬真實病例) , 在MedBench評測中多次登頂中文醫療AI榜首 。
燧原科技以國產算力為核心 , 聯合騰訊專有云TCE打造以AI為核心的智算云數據中心 , 圍繞GPU構建高性能網絡、存儲、云平臺、算力與模型MaaS平臺及安全平臺 , 全面滿足模型訓練、推理等智算場景需求 。 燧原科技首創“互聯網推理+城市推理”雙算力池模式 , 成為全國首個獲全滿分認證的國產超大規模推理集群 。 其新一代推理加速卡性能較上一代提升2倍+ , 性價比超旗艦GPU1.5倍+ , 通過騰訊專有云實現異構算力統一納管、租戶隔離與彈性擴縮容——支持1200+算力節點分鐘級擴縮容、業務遷移秒級完成 , 4天內即可完成萬卡規模部署 。
Digital Realty以300+數據中心、覆蓋6大洲50+城市的布局 , 構建全球最大智能基礎設施網絡 。 其亞太地區數據中心支持單機柜150kW高密度AI負載 , 通 ServiceFabric實現多云互聯與端口級靈活連接 , 帶寬按需調配 。 依托400G/800G光交換數據平面與智能工作流編排 , 支撐分布式AI訓練/推理 , 滿足低延遲、高吞吐量需求 , 為企業提供從數據湖到模型調優的全鏈路支撐 , 推動AI工作流在全球合規框架下高效落地 。
騰訊云通過AI Infra的技術革新 , 推動云計算從“資源時代”邁向“智能服務時代” 。 正如騰訊云副總裁沙開波所言:“未來的云計算基礎設施將具備自感知、自決策、自優化的能力 , 而騰訊云愿與伙伴共同加速這一進程 。 ”
來源:北青網

    推薦閱讀