繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

F5攜手NVIDIA全面增強AI時代的性能、多租户與安全能力

2025-07-09 12:48

巴黎,2025年7月9日 – 全球領先的應用交付和API安全解決方案提供商F5(NASDAQ:FFIV),日前宣佈F5 BIG-IP Next for Kubernetes推出全新功能。該解決方案深度整合NVIDIA BlueField-3 DPU以及NVIDIA DOCA軟件框架,並已通過歐洲客户Sesterce的實際部署驗證。Sesterce是歐洲領先的新一代基礎設施及主權人工智能(AI)運營商,致力於滿足加速計算與AI發展的嚴苛需求。 

作為對F5應用交付與安全平臺(F5 Application Delivery and Security Platform)的進一步擴展,BIG-IP Next for Kubernetes現可原生運行於NVIDIA BlueField-3 DPU,為大規模AI基礎設施提供高性能流量管理與安全防護,從而顯著提升AI應用的運行效率、控制能力與性能表現。今年早些時候,F5 曾在該解決方案正式發佈時公開普遍可用性並展示其卓越性能優勢。如今,Sesterce已完成對該聯合解決方案多項關鍵能力的驗證,涵蓋以下領域:

Sesterce首席執行官兼聯合創始人Youssef El Manssouri表示,「早在尚未進行任何測試前,F5與NVIDIA的集成方案就展現出令人矚目的潛力。通過在AI環境中實現高吞吐量的Kubernetes入口與出口流量,我們的測試結果印證了F5動態負載均衡技術的卓越優勢。該解決方案不僅提升了流量分發效率,優化了GPU資源利用率,同時也使我們能夠為客户提供更多差異化價值。我們很高興地看到F5正不斷拓展對NVIDIA多樣化應用場景的支持,包括增強型多租户功能。我們期待雙方在下一代AI基礎設施領域持續深化合作,推動更多技術創新。」

全新解決方案的核心能力價值包括:

藉助該聯合解決方案,企業可將簡單的AI相關任務路由至成本更低、更輕量級的LLM以支持生成式AI,同時將更復雜的查詢留給性能更強大的高階模型處理。該可定製化的智能路由機制還支持按領域調用特定 LLM,從而提升輸出質量並顯著改善客户體驗。F5的先進流量管理技術可確保查詢精準分發至最適合的模型節點,從而降低延迟並加快首個詞元生成時間。

F5首席創新官Kunal Anand表示,「當前,企業日益採用多模型架構以打造先進的AI體驗,但LLM 流量智能分類與路由計算資源消耗大,易導致系統性能下降並影響用户體驗。F5 BIG-IP Next for Kubernetes通過在NVIDIA BlueField-3 DPU上直接編寫路由邏輯,提供了業界當前最高效的LLM流量交付與安全解決方案。這僅僅是一個開始——我們的平臺正在為AI基礎設施釋放更多潛能。隨着企業級AI規模持續擴大,我們期待未來持續深化與NVIDIA的聯合創新。」

今年早些時候,NVIDIA推出Dynamo框架,旨在為生成式AI與推理模型在大規模分佈式環境中的部署提供支撐。通過統一調度、流量路由和內存管理等核心任務,NVIDIA Dynamo有效簡化了分佈式環境中AI推理的複雜性,確保其在動態工作負載下的穩定運行。F5與NVIDIA的聯合解決方案的核心優勢之一,是將部分計算操作從CPU卸載至BlueField DPU,從而顯著提升整體效率。藉助F5技術,Dynamo KV Cache Manager可基於容量智能路由請求,並通過鍵值(KV)緩存機制,顯著加速生成式AI應用的響應速度。該機制通過複用歷史運算信息,避免重複計算,顯著降低資源開銷。就基礎架構而言,企業通過KV緩存存儲與複用機制,相比直接佔用GPU昂貴的內存資源,能以更低成本實現性能優化。 

NVIDIA AI網絡與安全解決方案生態系統及市場營銷高級總監Ash Bhalgat表示,「採用NVIDIA BlueField-3 DPU加速的BIG-IP Next for Kubernetes,為企業與服務提供商提供了單點控制,助力AI工廠實現高效GPU利用率,並加速數據攝取、模型訓練、推理、檢索增強生成(RAG)及代理式AI等各類 AI 流量處理。此外,F5對多租户的支持以及iRules可編程性方面的持續優化,為未來進一步集成NVIDIA Dynamo分佈式KV Cache Manager等先進特性打下了堅實基礎。」

MCP是由Anthropic推出的一項開放協議,旨在標準化應用向LLM提供上下文信息的方式。通過在MCP服務器前端部署F5與NVIDIA聯合解決方案,F5可充當反向代理,從而增強MCP解決方案及其所支持LLM的安全能力。同時,F5 iRules提供的全數據可編程能力,能夠快速並靈活地響應AI協議的快速演進需求,並進一步抵禦新興網絡安全風險。 

World Wide Technology全球服務提供商高級副總裁Greg Schoeny表示,「實施代理式AI的企業日益依賴MCP部署來提升LLM的安全性與性能。F5與NVIDIA通過為大規模Kubernetes環境提供先進的流量管理與安全防護能力,打造了融合可編程性與自動化能力的AI 功能集,這一集成解決方案目前在業界尚無先例。」

基於NVIDIA BlueField-3 DPU平臺部署的F5 BIG-IP Next for Kubernetes現已全面上市。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。