谷歌今日发布新一代AI视频生成模型Veo 2,同时推出图像生成模型Imagen 3。人工评测显示,Veo 2在多项关键指标上领先业内竞品。 Veo 2最大亮点是支持4K视频生成,且能精准理解镜头类型、摄影特效等专业拍摄指令。相比此前仅能生成短视频的模型,Veo 2可输出数分钟长度的视频内容。在处理常见AI生成问题上,该模型显著减少了额外手指、随机物体等"幻觉"现象,并提升了物理效果的真实感。 在使用Meta's MovieGenBench数据集的1,003条提示词测试中,人工评估人员对比了各家720p分辨率、8秒长度的视频片段。结果显示,无论是整体画质还是指令执行准确度,Veo 2均优于包括OpenAI Sora Turbo在内的竞争对手。 谷歌表示,Veo 2目前将限定在VideoFX、YouTube等特定产品中使用,2025年将扩展至YouTube Shorts等更多应用。为确保内容可追溯,所有AI生成视频都将嵌入不可见的SynthID水印。 尽管取得突破,谷歌坦言Veo 2在处理复杂场景和动作序列时仍面临挑战,特别是在保持视频连贯性和真实感方面还有提升空间。
|