2025年1月9日,阿里推出的大语言模型通义千问迎来重大升级。此次升级通过自研的高效VAE和DiT架构,增强了时空上下文建模能力,支持无限长1080P视频的高效编解码,并首次实现了中文文字视频生成功能,使升级后的通义万相荣登VBench榜单第一。
在复杂人物运动展现方面,通义万相能够稳定呈现旋转、跳跃、转身、翻滚等复杂肢体动作及镜头移动。同时,模型可逼真还原现实物理规律,如雨滴落在伞上溅起水花、木雕制作时木屑掉落等场景。此外,中英文视频特效一键生成功能,提供艺术字及多种视频特效选项,增强视觉表现力。通义万相还具备强大的艺术风格表现力,可一键转换影视质感与艺术风格,精准还原影视级画面质感与细节。
通义万相2.1支持文生组图,采用IC-LoRA图像生成训练方法,利用DiT架构增强文本到图像的上下文能力,实现关联图像间的组合生成,保持特征稳定连续。用户可在通义万相官网体验分镜流畅、四格漫画、情侣头像等玩法,感受电影级分镜效果、创意漫画剧情及专属情侣头像定制。
即日起,用户还可进入阿里云百炼调用API体验升级后的通义万相模型能力。同时,评论区点赞前3的用户可领取通义2025年定制日历,活动截止时间为2025年1月17日17:00。
|
声明:
本站所有内容来源于用户上传,用来分享交流。如有资料或者图片不小心侵权,请发邮件(41835170@qq.com)告知!