谷歌发布Veo 2视频生成模型，人工评测超越OpenAI Sora Turbo

小哪吒

谷歌今日发布新一代AI视频生成模型Veo 2，同时推出图像生成模型Imagen 3。人工评测显示，Veo 2在多项关键指标上领先业内竞品。

Veo 2最大亮点是支持4K视频生成，且能精准理解镜头类型、摄影特效等专业拍摄指令。相比此前仅能生成短视频的模型，Veo 2可输出数分钟长度的视频内容。在处理常见AI生成问题上，该模型显著减少了额外手指、随机物体等"幻觉"现象，并提升了物理效果的真实感。

在使用Meta's MovieGenBench数据集的1,003条提示词测试中，人工评估人员对比了各家720p分辨率、8秒长度的视频片段。结果显示，无论是整体画质还是指令执行准确度，Veo 2均优于包括OpenAI Sora Turbo在内的竞争对手。

谷歌表示，Veo 2目前将限定在VideoFX、YouTube等特定产品中使用，2025年将扩展至YouTube Shorts等更多应用。为确保内容可追溯，所有AI生成视频都将嵌入不可见的SynthID水印。

尽管取得突破，谷歌坦言Veo 2在处理复杂场景和动作序列时仍面临挑战，特别是在保持视频连贯性和真实感方面还有提升空间。