2 min read

NVIDIA cuVS革新GPU向量搜索:AI驱动的规模化检索新纪元

AI驱动的搜索需求正以前所未有的速度增长,对高性能索引、低延迟检索和可扩展性提出了严峻挑战。NVIDIA cuVS(CUDA Vector Search)库的最新版本,通过GPU加速的向量搜索和聚类技术,显著提升了AI搜索的效率和规模。

cuVS通过优化索引算法,如对DiskANN(Vamana)的GPU实现,实现了高达40倍的性能提升,并与Google Cloud AlloyDB、Oracle Database 23ai、Weaviate、Apache Lucene、Elasticsearch、OpenSearch、Milvus等主流数据库及生态系统深度集成,大幅缩短了索引构建时间,部分场景可达8倍至22倍的加速。其核心亮点在于GPU与CPU之间的索引互操作性,允许在GPU上高效构建索引,然后在CPU上进行低成本、低延迟的搜索,为大规模检索增强生成(RAG)等应用提供了极大的灵活性。

此外,cuVS引入了动态批处理API,将高吞吐量在线搜索性能提升高达10倍,并优化了CAGRA算法的预过滤能力,在高召回率下实现高效搜索。通过支持二进制和标量量化,cuVS将向量存储需求降低4到32倍,同时带来4到20倍的性能提升。nn-descent算法的更新也使得大规模KNN图构建成为可能,赋能接近实时的探索性数据分析。cuVS通过提供更快的索引构建、更低的成本和更简化的开发流程,正在重塑GPU加速向量搜索的格局,使AI驱动的搜索能力在更大规模上得以实现。

Optimizing Vector Search for Indexing and Real-Time Retrieval with NVIDIA cuVS | NVIDIA Technical Blog
AI-powered search demands high-performance indexing, low-latency retrieval, and seamless scalability. NVIDIA cuVS brings GPU-accelerated vector search and clustering to developers and data scientists…
订阅情报