北京智谱华章科技有限公司近日宣布,其旗下的AI视频生成产品“清影”实现了全面技术升级,迈入了新的发展阶段。新清影在视频生成技术方面取得了显著进步,现支持10秒时长、4K分辨率、60帧超高清画质,并能生成任意尺寸视频,自带音效,同时在人体动作和物理世界模拟方面也有所提升。
三个月前,清影作为国内首个面向公众开放的视频生成产品,通过清言App上线,用户只需提供一段指令或图片,30秒内即可生成AI视频。这一创新为广告制作、短视频、表情包梗图等影视创作领域带来了新的玩法。
技术团队GLM随后开源了CogVideoX 2B和5B版本模型,这些模型能在消费级显卡上流畅运行,其中CogVideoX-5B模型自开源以来受到广泛关注,并衍生出大量二次开发项目。
新清影的升级基于CogVideoX模型的最新技术进展和新推出的音效模型CogSound,主要在以下五个方面实现了提升: - 模型能力全面提升:在图生视频的质量、美学表现、运动合理性以及复杂提示词语义理解方面能力显著增强。
- 4K超高清分辨率:支持生成10秒、4K、60帧超高清视频,提供极致的视觉体验和流畅的动态画面。
- 可变比例:支持任意比例的图像生成视频,适应不同的播放需求。
- 多通道生成能力:同一指令/图片可以一次性生成4个视频。
- 带声效的AI视频:新清影能够生成与画面匹配的音效,音效功能将于本月上线公测。
新清影现已在智谱清言App上线,为影视工作者和短视频创作者提供了产量和产能的提升,在其生产流程中发挥重要作用。不到一年时间,生成视频技术在视频时长、生成速度、分辨率、一致性等方面已经显示出长足进步。智谱华章科技表示,未来将与视觉中国等合作伙伴携手,基于更丰富的视觉内容,产出更好的AI生成视频工具。
新清影即日起在智谱清言 App 上线:https://chatglm.cn/video
为了支持广大开发者,我们也同时将 CogVideoX v1.5-5B、CogVideoX v1.5-5B-I2V 进行了开源。开源地址:https://github.com/thudm/cogvideo
|