智能体AI时代:F5与英伟达联手,以BlueField-3 DPU重塑AI云基础设施
AI正从生成式AI向智能体AI(Agentic AI)演进,后者具备规划、研究和推理能力,这使得AI工作流日益复杂。为高效部署智能体AI应用,AI云需要软件定义、硬件加速的应用交付与安全平台(ADSP)。
F5 BIG-IP Next for Kubernetes(BNK)与英伟达BlueField-3 DPU的结合,显著优化了智能体AI的应用交付与部署。该平台提供了动态负载均衡、强化安全、云原生多租户以及丰富的可观测性,同时通过运营效率和优化的功耗降低了总体拥有成本。智能体AI通过多组件协同工作,如NVIDIA的数字人蓝图工作流,涉及LLMs、向量数据库、RAG、语音识别和渲染等。其复杂性要求分布式、解耦的多节点基础设施,包含加速计算、网络和存储,以处理组件间持续的数据流动。BlueField-3 DPU作为加速网络平台,融合高性能可编程加速引擎与高能效Arm核心,是优化AI云和AI工厂数据流动的关键。
英伟达为AI云运营商(NCP)设计的参考架构中,BlueField是核心组件,它高效处理GPU集群的南北向网络流量,包括集群间通信和存储访问。F5 BNK加速后,能为AI云提供高性能云原生网络和规模化的零信任安全,简化智能体AI的部署与运营。BNK通过学习并路由流量到Kubernetes命名空间,实现真正的云原生负载均衡,并支持GPU资源在多租户间的有效隔离与利用。此外,BNK通过将数据路径从主机CPU卸载到DPU的Arm核心,显著提升了网络能效,实现了更高吞吐量和更低功耗。
软银的实践验证了这一优势。在与英伟达H100 GPU集群的PoC中,BNK加速的BlueField-3在75 Gbps吞吐量下无需消耗CPU核心,而开源NGINX则消耗30个核心;BNK的HTTP GET响应延迟降低11倍,CPU利用率降低99%,网络能效(吞吐量/瓦特)提升190倍。此结果表明,DPU加速的应用交付与安全平台能有效应对现代AI工作负载的严苛需求。

网友讨论