这份文件是华创证券发布的关于传媒行业深度研究的报告,主题为“多模态AI的五重奏,国产大模型的探索序章”,发布日期为2024年4月3日。报告主要探讨了多模态人工智能技术在文本、图片、视频、音频和3D领域的应用现状和发展趋势,并提出了投资建议。以下是报告的核心内容概述: 多模态AI的重要性:大模型的多模态迭代对企业发展的三种模式有直接影响,包括大模型与原有业务的结合、开源大模型与AI产品的结合、垂类模型与行业数据的结合。 文本领域:国产大模型在中文长文本处理方面展现出差异化优势,如Kimi(月之暗面)和冒泡鸭/MoE(阶跃星辰)等。预计未来的竞争将围绕用户定制化展开。 图片领域:AI生图技术已趋于成熟,头部AI图片产品的用户访问量稳定,显示出商业化进程的潜力。 视频领域:AI生成视频技术正在快速发展,国内外均有竞争力的产品出现,如国内的爱诗科技PixVerse产品。 音频领域:AI音频产品分为TTS、SVC和AI音乐等类型,科技大厂在TTS领域具有优势,而AI音乐领域则有较大的发展空间。 3D领域:AI生成3D模型仍处于早期阶段,精度不足限制了商业化应用,但长期来看有望助力视频和游戏行业的发展。
|