当前位置:»资讯 AI新闻 全球AI最前线

[行业动态] 智谱推出新清影:模型全面升级、4K、任意比例、自带音效

WX20241110-203450@2x.png

北京智谱华章科技有限公司近日宣布,其旗下的AI视频生成产品“清影”实现了全面技术升级,迈入了新的发展阶段。新清影在视频生成技术方面取得了显著进步,现支持10秒时长、4K分辨率、60帧超高清画质,并能生成任意尺寸视频,自带音效,同时在人体动作和物理世界模拟方面也有所提升。


三个月前,清影作为国内首个面向公众开放的视频生成产品,通过清言App上线,用户只需提供一段指令或图片,30秒内即可生成AI视频。这一创新为广告制作、短视频、表情包梗图等影视创作领域带来了新的玩法。


技术团队GLM随后开源了CogVideoX 2B和5B版本模型,这些模型能在消费级显卡上流畅运行,其中CogVideoX-5B模型自开源以来受到广泛关注,并衍生出大量二次开发项目。


新清影的升级基于CogVideoX模型的最新技术进展和新推出的音效模型CogSound,主要在以下五个方面实现了提升:

  • 模型能力全面提升:在图生视频的质量、美学表现、运动合理性以及复杂提示词语义理解方面能力显著增强。
  • 4K超高清分辨率:支持生成10秒、4K、60帧超高清视频,提供极致的视觉体验和流畅的动态画面。
  • 可变比例:支持任意比例的图像生成视频,适应不同的播放需求。
  • 多通道生成能力:同一指令/图片可以一次性生成4个视频。
  • 带声效的AI视频:新清影能够生成与画面匹配的音效,音效功能将于本月上线公测。


新清影现已在智谱清言App上线,为影视工作者和短视频创作者提供了产量和产能的提升,在其生产流程中发挥重要作用。不到一年时间,生成视频技术在视频时长、生成速度、分辨率、一致性等方面已经显示出长足进步。智谱华章科技表示,未来将与视觉中国等合作伙伴携手,基于更丰富的视觉内容,产出更好的AI生成视频工具。


新清影即日起在智谱清言 App 上线:
https://chatglm.cn/video

为了支持广大开发者,我们也同时将 CogVideoX v1.5-5B、CogVideoX v1.5-5B-I2V 进行了开源。开源地址:
https://github.com/thudm/cogvideo

声明: 本站所有内容来源于用户上传,用来分享交流。如有资料或者图片不小心侵权,请发邮件(41835170@qq.com)告知!
分享到:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

豫ICP备2024052610号-1 ©AI闹海