英伟达利用苹果Vision Pro采集机器人训练数据

小哪吒

VS-YouTube-WhatsNextinAINVIDIAsJensenHuangTalksWithWIREDsLaurenGoode-5443-1200x675.jpg

英伟达近日宣布，正在利用苹果Vision Pro头显来收集更真实的机器人训练数据，以缩小人形机器人的"仿真差距"。

作为其Project Gr00t人形机器人AI平台的一部分，英伟达正探索结合人工生成和合成数据的方法。英伟达embodied AI部门高级研究经理Jim Fan在LinkedIn上解释，他们使用Vision Pro记录人类的示范动作。佩戴者可以从第一人称视角控制机器人，完成诸如制作吐司或从橱柜取杯子等日常任务。

Fan表示："Vision Pro实时解析人手姿势并将动作重定向到机器人手上。从人的角度看，他们仿佛置身于另一具身体中，如同《阿凡达》中的场景。"

为了扩充数据集，英伟达利用RoboCasa仿真框架将原始数据增加1000倍以上。其MimicGen系统进一步生成新动作，并过滤掉失败尝试。Fan强调，这种方法打破了传统远程操作每天24小时的限制，可以在数字世界中大规模生成训练数据。

英伟达CEO黄仁勋在今年的Siggraph大会上阐述了机器人开发中的"三计算机问题"：分别需要不同的计算机来创建AI、进行仿真和在实际机器人中运行。这种多阶段方法确保AI模型在实际部署前得到充分设计、测试和优化。

通过结合真实世界数据和合成数据，英伟达旨在缩小仿真与现实之间的差距，为更先进可靠的机器人应用铺平道路。公司已开源RoboCasa平台，MimicGen的人形机器人版本也在开发中。

这一创新方法展示了虚拟现实技术在AI和机器人领域的潜力，有望加速人形机器人的发展进程。