7月6日,在2024世界人工智能大会期间,快手在以“新AI·新应用·新生态”为主题的大模型论坛上,发布了视频生成大模型可灵和图像生成大模型可图的多项新功能。 在此次论坛上,可灵推出了高画质版,并新增了首尾帧控制和镜头控制等功能,同时将创作者单次生成的视频时长扩展至10秒。与此同时,可图宣布正式开源,旨在激发行业活力,共同构建一个繁荣的图像生成大模型社区生态。
快手高级副总裁盖坤表示,公司将持续加大AI领域的投入,推动技术创新,致力于为用户带来最佳的AI技术体验。
用AI重塑内容理解、分发与生产
盖坤介绍,快手已建立了以快意语言大模型、推荐大模型、视觉生成大模型为核心的大模型矩阵。快手的推荐大模型SIM,参数规模达到十万亿级别。
快手副总裁张迪表示,公司将利用大模型技术重塑业务,通过升级理解、创新互动、探索生成,在内容生产方面打造新一代AIGC创作和素材工具,提供低门槛、智能化的内容生产体验;在内容消费领域,升级平台的内容理解和分发体系,以提升用户消费体验。
商业化应用成果显著
快手商业化外循环和AI商业产品负责人刘逍透露,近2万平台商家已借助大模型能力实现智能化经营。与今年1月相比,6月的AIGC月活跃客户数增长了8倍。刘逍表示,新工具如磁力开创、女娲数字人、π数字员工等将持续为商家赋能,深化AI技术在商业化中的应用。
可灵AI功能升级
在本次论坛上,可灵AI基础模型进行了升级,推出了更高画质的版本和新的编辑功能,包括首尾帧控制和镜头控制,同时将创作者单次生成的视频时长增加至10秒。可灵自6月6日发布文生视频功能以来,已支持用户生成最长3分钟的视频,并以真实世界物理规则为基准,生成具有电影级别画质与动态效果的视频。
截至目前,已有超过50万用户申请可灵的内测资格,视频生成数量达700万。团队将继续提升模型基础质量,增强画质清晰度,并引入更多创新功能。
共建繁荣的图像生成大模型生态
在图像生成领域,可图凭借其复杂语义理解能力、摄影级画面质感、多条件可控风格化生成等核心优势,正式开源。同时,中国计算机学会(CCF)宣布与快手共同成立“CCF-快手大模型探索者基金”,以应对AI技术迅猛发展的趋势,聚焦新一代大模型的关键技术研发。
双方致力于深化学术研究与工业实践的融合,培育大模型领域的科研及工程技术人才。基金特别针对五大领域推出12个研究项目,每项课题最高可获30万元人民币的支持。
|