NVIDIA Blackwell Ultra GPU:AI算力新纪元的双芯片驱动力
NVIDIA发布了其Blackwell Ultra GPU,这是Blackwell架构家族的新成员,旨在通过创新的双芯片设计、第五代Tensor Cores和突破性的NVFP4精度格式,显著提升AI训练和推理性能。该GPU融合了先进的硅创新与系统级集成,为AI工厂和大规模实时AI服务提供了下一代性能、可扩展性和能效。
Blackwell Ultra的核心在于其160个流式多处理器(SM),集成了640个支持NVFP4格式的Tensor Cores,提供高达15 PetaFLOPS的密集计算能力。其双芯片设计通过NVIDIA高速互连技术(NV-HBI)实现10 TB/s的带宽。新增的NVFP4格式在保持接近FP8的精度下,将内存占用减少了高达3.5倍,极大地提高了低精度AI推理的效率和性能。
此外,Blackwell Ultra的SM中的特殊功能单元(SFU)吞吐量翻倍,加速了Transformer模型的注意力机制,使AI推理速度提升高达2倍,尤其对长上下文窗口的模型效益显著。GPU配备了288 GB的HBM3e内存,提供8 TB/s的带宽,支持处理万亿参数的模型,并支持第五代NVLink以实现大规模GPU互连。
该GPU还具备企业级特性,包括增强的GigaThread引擎、多实例GPU(MIG)分区、机密计算和先进的可靠性系统(RAS)。视频和数据处理能力也得到加强,集成了NVDEC和NVJPEG等专用硬件单元,并通过DALI库集成到AI工作流中。Blackwell Ultra GPU是NVIDIA下一代AI基础设施的基石,为AI工厂带来了前所未有的性能、效率和规模。
Inside NVIDIA Blackwell Ultra: The Chip Powering the AI Factory Era | NVIDIA Technical Blog
As the latest member of the NVIDIA Blackwell architecture family, the NVIDIA Blackwell Ultra GPU builds on core innovations to accelerate training and AI reasoning. It fuses silicon innovations with…

网友讨论