2 min read

NVIDIA驱动机器人革命:世界基础模型重塑数据生成与训练范式

NVIDIA正通过其前沿研究,为机器人领域引入革命性的数据生成与训练范式。其核心在于利用世界基础模型(WFMs)如NVIDIA Cosmos,结合DreamGen等数据生成蓝图,大幅削减了为新任务和环境收集标注数据的成本与时间。

DreamGen管道通过后训练世界基础模型、生成合成视频、提取伪动作以及训练机器人策略,实现了高效、逼真的训练数据创建。这一流程将机器人学习的开发时间从数月缩短至数小时,显著提升了模型的泛化能力和鲁棒性。以GR00T N1.5为例,利用NVIDIA的合成数据生成技术,仅用36小时便完成了对GR00T N1的升级,而传统方法则需近三个月。

此外,Latent Action Pretraining from Videos(LAPA)作为一种无监督方法,利用大量互联网视频学习机器人相关动作,无需手动标注,效率提升超过30倍。Sim-and-Real Co-Training工作流则通过融合真实世界与模拟数据,有效解决了成本和“现实差距”问题,即使在数据充裕的情况下,也能使协同训练策略比仅使用真实数据训练的策略性能提升38%。这些技术正被AeiRobot、Foxlink等领先企业采纳,加速其工业机器人和自动化系统的开发与部署。

R²D²: Training Generalist Robots with NVIDIA Research Workflows and World Foundation Models | NVIDIA Technical Blog
A major challenge in robotics is training robots to perform new tasks without the massive effort of collecting and labeling datasets for every new task and environment. Recent research efforts from…
订阅情报