2 min read

RAPIDS 25.06:GPU数据科学引擎革新,Polars流式处理与GNN统一API引领性能飞跃

NVIDIA RAPIDS 25.06版本发布,核心亮点在于其对Python数据科学库的重大升级,特别是Polars GPU引擎的增强,引入了实验性的流式执行器,支持处理大于VRAM的数据集,并能通过Dask实现多GPU并行计算,极大地扩展了大规模数据分析的能力。同时,对时间序列处理的.rolling()函数和日期时间列操作进行了优化,提升了数据处理的灵活性与效率。

在图神经网络(GNN)领域,cuGraph-PyG通过与WholeGraph集成,推出了统一API,实现了跨单GPU、多GPU及多节点训练脚本的无缝迁移,降低了开发门槛。

此外,cuML的“零代码更改”加速功能进一步扩展,新增了对支持向量机(SVC和SVR)的加速支持,允许用户无需修改现有scikit-learn代码即可获得GPU性能提升。此版本还优化了cuML与scikit-learn的兼容性,并集成了Forest Inference Library以增强随机森林模型的性能。

在底层硬件支持上,RAPIDS Memory Manager(RMM)新增对NVIDIA Blackwell GPU硬件解压引擎的支持,为I/O密集型工作流带来性能改进。平台方面,RAPIDS 25.06支持Python 3.13,并标志着对CUDA 11的最后支持,后续版本将转向更新的CUDA版本。

RAPIDS Adds GPU Polars Streaming, a Unified GNN API, and Zero-Code ML Speedups | NVIDIA Technical Blog
RAPIDS, a suite of NVIDIA CUDA-X libraries for Python data science, released version 25.06, introducing exciting new features. These include a Polars GPU streaming engine, a unified API for graph…
订阅情报