【TechWeb】7月9日消息 , 全球應用交付和API安全解決方案提供商F5宣布F5 BIG-IP Next for Kubernetes推出全新功能 , 該解決方案深度整合NVIDIA BlueField-3 DPU以及NVIDIA DOCA軟件框架 , 并已通過歐洲客戶Sesterce的實際部署驗證 。
作為對F5應用交付與安全平臺(F5 Application Delivery and Security Platform)的進一步擴展 , BIG-IP Next for Kubernetes現可原生運行于NVIDIA BlueField-3 DPU , 為大規模AI基礎設施提供高性能流量管理與安全防護 , 從而顯著提升AI應用的運行效率、控制能力與性能表現 。
借助該聯合解決方案 , 企業可將簡單的AI相關任務路由至成本更低、更輕量級的LLM以支持生成式AI , 同時將更復雜的查詢留給性能更強大的高階模型處理 。 該可定制化的智能路由機制還支持按領域調用特定 LLM , 從而提升輸出質量并顯著改善客戶體驗 。 F5的先進流量管理技術可確保查詢精準分發至最適合的模型節點 , 從而降低延遲并加快首個詞元生成時間 。
今年早些時候 , NVIDIA推出Dynamo框架 , 旨在為生成式AI與推理模型在大規模分布式環境中的部署提供支撐 。 通過統一調度、流量路由和內存管理等核心任務 , NVIDIA Dynamo有效簡化了分布式環境中AI推理的復雜性 , 確保其在動態工作負載下的穩定運行 。 F5與NVIDIA的聯合解決方案的核心優勢之一 , 是將部分計算操作從CPU卸載至BlueField DPU , 從而顯著提升整體效率 。 借助F5技術 , Dynamo KV Cache Manager可基于容量智能路由請求 , 并通過鍵值(KV)緩存機制 , 顯著加速生成式AI應用的響應速度 。 該機制通過復用歷史運算信息 , 避免重復計算 , 顯著降低資源開銷 。 就基礎架構而言 , 企業通過KV緩存存儲與復用機制 , 相比直接占用GPU昂貴的內存資源 , 能以更低成本實現性能優化 。
【F5攜手英偉達全面增強AI時代的性能、多租戶與安全能力】另外 , 通過在MCP服務器前端部署F5與NVIDIA聯合解決方案 , F5可充當反向代理 , 從而增強MCP解決方案及其所支持LLM的安全能力 。 同時 , F5 iRules提供的全數據可編程能力 , 能夠快速并靈活地響應AI協議的快速演進需求 , 并進一步抵御新興網絡安全風險 。
推薦閱讀
- BW2025玩創星球即將啟幕,七彩虹攜手 NVIDIA破界AI次元
- CS專業爆冷,失業率達藝術史2倍,年入千萬只需5年,大學卻在禁Cursor
- 英偉達鐵王坐不穩?ASIC成“心腹大患”,三大軟肋暴露無遺
- 7月10日官宣!英特爾攜手小旺AI截圖,深度適配英特爾AIPC
- 消息稱馬斯克旗下SpaceX正籌劃新一輪融資 估值預計將達4000億美元
- 英偉達GB10超級芯片獲多家PC品牌采用,即將大量出貨
- 華為Pura80系列電池最高達5700mAh,一文了解華為P系列手機電池
- 英偉達B200芯片,供不應求
- PICO與Red Stone USA Inc達成北美分銷合作
- 減配不降價!英偉達RTX 5090新款中國特供版即將上市
