北京,2024年5月6日 —— 钛媒体今日独家披露,国内AI领域独角兽企业智谱AI正在紧锣密鼓地研发一款高质量的文生视频模型,该模型将直接对标OpenAI的Sora,预计最快于今年内发布。这一进展标志着中国在AI大模型技术领域的又一重要突破。 智谱AI,这家由清华大学计算机系技术成果转化而来的公司,自成立以来便备受瞩目。公司CEO张鹏及其团队凭借深厚的学术背景和丰富的行业经验,带领智谱AI成为国内最早入局大模型赛道的公司之一,并且迅速成长为国内头部大模型厂商的代表。
据智谱AI内部人士透露,“文生视频技术正迅速发展,预计今年将迎来大模型的爆发期。国内市场对文生视频技术的需求日益增长,覆盖电影、短视频、游戏制作等多个领域。智谱AI致力于通过更高质量数据和更大参数量,开发出能够满足多样化需求的文生视频产品。”
智谱AI在2023年3月推出了千亿级开源基座对话模型ChatGLM系列,并在一年内完成了四次升级,今年1月推出了GLM4系列。基于全自研的基座大模型能力,智谱AI已经构建了包括AI提效助手智谱清言、高效率代码模型CodeGeeX、多模态理解模型CogVLM和文生图模型CogView在内的AIGC模型产品矩阵。
张鹏在今年3月透露,截至2023年底,智谱AI已拥有超过2000家生态合作伙伴,超过1000个大模型规模化应用案例,200多家企业与智谱AI进行了深度共创。这些合作覆盖了传媒、咨询、消费、金融、新能源、互联网、智能办公等多个细分场景的头部企业。
智谱AI的开源策略也取得了显著成效。张鹏强调,智谱ChatGLM-6B的全球累计下载量已超过1300万,GitHub Star星数达到5万,量级超过Meta Llama两个版本的总和。智谱AI已位列全球最受欢迎的开源机构第五名,成为唯一上榜的中国机构,其影响力可见一斑。
在融资方面,智谱AI已完成五轮融资,投资方包括君联资本、启明创投、中科创星、美团、蚂蚁、阿里、腾讯、小米、金山、顺为、Boss直聘、好未来、红杉、高瓴等知名机构。2023年融资额超过25亿元人民币,最新一轮融资于2024年3月由北京市人工智能产业投资基金参与。
智谱AI的综合能力水平得到了内部人士的高度评价,称其性能“接近海外顶级模型”。最新基座大模型GLM-4的性能相比上一代大幅提升,逼近GPT-4。在中文对齐任务下,智谱AI甚至可以略微超过GPT-4。根据海外伯克利Arena Hard基准测试,GLM排名仅次于GPT-4 Turbo和Claude 3 Opus,显示出智谱AI在国内外模型中的领先地位。
智谱AI内部人士强调,公司投入时间较早,拥有完全自主、自研、国产化的千亿级模型算法,并实现全栈国产化,从底层到模型层、应用层、应用接口PaaS层等实现全栈自主研发。智谱AI的模型种类与全球最先进的OpenAI形成了一一对标。
尽管智谱AI已研发出多模态模型GLM-4,但公司早在今年2月Sora发布之前,就已经开始研发文生视频模型。智谱AI内部人士坦言,对标Sora的文生视频模型发展突破的关键在于技术路线选择和训练所用的高质量视频素材语料。
“技术路线上,Transformer与Diffusion的结合架构如何在效率和效果上进行优化,如何解决连续帧之间的抖动问题,如何在满足高分辨率的同时实现高一致性的长序列生成,如何获取高质量数据泛化到更多更细节的真实场景,都是技术上需要解决的问题。”上述人士称。
值得注意的是,智谱AI投资的生数科技与清华大学联合发布了中国首个长时长、高一致性、高动态性视频大模型Vidu,被称为“国内首个Sora级视频模型”,也是中国首个纯自研视频大模型。智谱AI若发布类似的文生视频模型,将与生数科技产生竞争关系。
智谱AI以产业型投资方式,已经投资、入股超过13家AI产业链的初创公司。张鹏曾表示,智谱AI正在经历从量变到质变的过程,特别是大模型的涌现。公司目标是瞄准AGI(人工通用智能),实现超过人类水平的超级认知智能、实现AI的自我解释、自我评测、自我监督,同时确保模型安全、可控。
智谱AI的这一新动向,无疑将为国内AI产业注入新的动力,同时也为全球AI技术的发展带来新的竞争格局。
|