在 2025 年拉斯维加斯举行的 CES 上,Nvidia 宣布推出其自有品牌的 Cosmos 世界模型系列。这些 AI 模型旨在模拟人类对世界的自然理解,能够预测和生成具有物理感知的视频。Cosmos 世界基础模型(Cosmos WFM)分为 Nano、Super 和 Ultra 三种类型,分别适用于低延迟实时应用、高性能基线模型以及最高质量和保真度的输出.
Nvidia 表示,这些模型基于 2000 万小时的真实世界数据进行训练,涵盖人际互动、环境、工业、机器人和驾驶等多个领域。Cosmos WFM 的参数规模从 40 亿到 140 亿不等,参数数量越多,模型解决问题的能力越强。此外,Nvidia 还发布了“上采样模型”和针对增强现实优化的视频解码器,以确保模型的负责任使用,并针对特定应用进行微调.
尽管 Nvidia 未透露训练数据的具体来源,但其发言人强调,Cosmos 的学习方式与人类相似,数据使用符合法律要求。Nvidia 声称,Cosmos WFM 能够生成高质量的合成数据,助力机器人、无人驾驶汽车等模型的训练。目前,包括 Waabi、Wayve、Fortellix 和 Uber 在内的多家公司已承诺在不同场景中试用 Cosmos WFM
值得注意的是,Nvidia 的世界模型并非严格意义上的开源,而是被称为“开放”模型,因为其未提供从头开始重建模型所需的所有工具和训练数据的详细信息.
|
声明:
本站所有内容来源于用户上传,用来分享交流。如有资料或者图片不小心侵权,请发邮件(41835170@qq.com)告知!