NVIDIA cuQuantum 25.06:AI赋能量子计算设计,模拟速度实现数量级飞跃
NVIDIA cuQuantum 25.06 SDK的发布,标志着量子计算模拟领域的一项重大进展。该SDK通过优化库和工具,显著加速了量子计算的仿真过程,尤其是在结合NVIDIA Tensor Core GPU时,能在量子动力学、状态向量和张量网络方法上实现数量级的性能提升。此次更新的核心亮点包括:为量子动力学工作流引入了梯度计算能力,进一步优化了对NVIDIA Grace Blackwell、GB200 NVL72及GB300 NVL72系统的支持,并为密度矩阵重整化群(DMRG)张量网络算法提供了基础构建模块。
cuDensityMat新API的引入,使得量子态演化的梯度计算更为便捷。这对于量子哈密顿动力学框架和求解器的开发者至关重要,它支持高效地对量子动力学仿真进行反向传播,从而优化可调谐的哈密顿量参数。这一能力为量子处理器单元(QPU)的理性设计开辟了高效路径,使QPU制造商能够训练大型AI模型,加速校准、控制、门和量子比特设计,从而缩短实现实用量子处理器的周期。在NVIDIA B200 GPU上,针对通用的通量量子比特系统(包括量子比特和谐振器),cuDensityMat在正向传播和反向传播计算上均实现了16-26倍的速度提升,远超基于GEMM的JAX实现。
cuStateVec针对最新的NVIDIA GPU架构进行了进一步的定制化GPU内核优化,相较于NVIDIA Hopper系统,性能提升约2-3倍。这些优化使得研究人员能够充分发挥先进NVIDIA硬件的潜力,特别是在涉及批处理、期望值计算和坍缩算子等操作时,性能表现尤为突出。cuTensorNet的最新版本则首次提供了矩阵乘积态(MPS)和密度矩阵重整化群(DMRG)的基元,使开发者和研究人员能够将DMRG应用于量子计算模拟。通过提供迭代优化MPS近似量子电路保真度的基元,cuTensorNet简化了DMRG的GPU加速应用,并支持通过MPS时间依赖变分原理(MPS-TDVP)算法进行量子动力学模拟。这些基元是未来cuQuantum支持更多新功能的基础,包括更大规模的MPS量子电路模拟和QPU设计所需的近似量子动力学模拟。

网友讨论