SynthDa:以合成数据突破人体动作识别瓶颈,赋能AI安全关键应用
由NVIDIA AI技术中心(亚太南部)与新加坡理工大学合作开发的SynthDa,是一套创新的合成数据增强流水线,旨在解决人工智能在人体动作识别领域面临的数据稀疏性挑战。该系统通过模块化设计,能够利用现有真实世界数据生成具有不同视角和光照条件的合成数据,显著提升模型在复杂环境下的泛化能力,同时规避了大规模手动标注的成本与隐私顾虑。
SynthDa的核心价值在于其生成逼真训练数据的能力,通过合成运动序列和视角随机化,无需昂贵的标注即可增强模型鲁棒性。其“Synthetic mix”模式通过3D骨骼动画和虚拟环境渲染,创造出多样化的动作表现;“Real mix”模式则通过插值真实动作序列,生成更自然的过渡。这种灵活性使其能够无缝集成至NVIDIA TAO Toolkit等现有框架,为安防监控、老年看护、工业监测及教育科研等安全关键应用提供强大支持。
目前,SynthDa已在教育领域得到实际应用,新加坡南洋理工大学教育学院的研究人员正利用其为科学实验生成合成数据,以训练能够实时监控学生行为的AI模型,提升教学安全性。日本滋贺大学的研究团队也将其应用于自行车安全使用场景的动作数据生成,而东京大学Matsuo-Iwasawa实验室则探索其在机器人模仿学习及沉浸式环境中的应用潜力。SynthDa的模块化架构预示着其未来将进一步扩展至多人动作识别,并针对医疗、机器人等特定领域进行精细化调优,为AI在现实世界中的广泛部署奠定坚实基础。
Improving Synthetic Data Augmentation and Human Action Recognition with SynthDa | NVIDIA Technical Blog
Human action recognition is a capability in AI systems designed for safety-critical applications, such as surveillance, eldercare, and industrial monitoring. However, many real-world datasets are…

网友讨论