3 min read

NVIDIA cuQuantum 25.06:AI赋能量子计算设计,模拟速度实现数量级飞跃

NVIDIA cuQuantum 25.06 SDK的发布,标志着量子计算模拟领域的一项重大进展。该SDK通过优化库和工具,显著加速了量子计算的仿真过程,尤其是在结合NVIDIA Tensor Core GPU时,能在量子动力学、状态向量和张量网络方法上实现数量级的性能提升。此次更新的核心亮点包括:为量子动力学工作流引入了梯度计算能力,进一步优化了对NVIDIA Grace Blackwell、GB200 NVL72及GB300 NVL72系统的支持,并为密度矩阵重整化群(DMRG)张量网络算法提供了基础构建模块。

cuDensityMat新API的引入,使得量子态演化的梯度计算更为便捷。这对于量子哈密顿动力学框架和求解器的开发者至关重要,它支持高效地对量子动力学仿真进行反向传播,从而优化可调谐的哈密顿量参数。这一能力为量子处理器单元(QPU)的理性设计开辟了高效路径,使QPU制造商能够训练大型AI模型,加速校准、控制、门和量子比特设计,从而缩短实现实用量子处理器的周期。在NVIDIA B200 GPU上,针对通用的通量量子比特系统(包括量子比特和谐振器),cuDensityMat在正向传播和反向传播计算上均实现了16-26倍的速度提升,远超基于GEMM的JAX实现。

cuStateVec针对最新的NVIDIA GPU架构进行了进一步的定制化GPU内核优化,相较于NVIDIA Hopper系统,性能提升约2-3倍。这些优化使得研究人员能够充分发挥先进NVIDIA硬件的潜力,特别是在涉及批处理、期望值计算和坍缩算子等操作时,性能表现尤为突出。cuTensorNet的最新版本则首次提供了矩阵乘积态(MPS)和密度矩阵重整化群(DMRG)的基元,使开发者和研究人员能够将DMRG应用于量子计算模拟。通过提供迭代优化MPS近似量子电路保真度的基元,cuTensorNet简化了DMRG的GPU加速应用,并支持通过MPS时间依赖变分原理(MPS-TDVP)算法进行量子动力学模拟。这些基元是未来cuQuantum支持更多新功能的基础,包括更大规模的MPS量子电路模拟和QPU设计所需的近似量子动力学模拟。

NVIDIA cuQuantum Adds Dynamics Gradients, DMRG, and Simulation Speedup | NVIDIA Technical Blog
NVIDIA cuQuantum is an SDK of optimized libraries and tools that accelerate quantum computing emulations at both the circuit and device level by orders of magnitude. With NVIDIA Tensor Core GPUs…
订阅情报