火山引擎于2024年10月15日举办的视频云技术大会上,宣布了一系列音视频全链路智能升级方案,标志着视频产业正式迈入智能化时代。火山引擎此次发布的大模型训练视频预处理方案,有效解决了视频大模型训练中的成本、质量和性能挑战,已成功应用于豆包·视频生成模型中。
火山引擎总裁谭待表示,通过与英特尔的合作,火山引擎利用自研多媒体处理框架BMF,结合英特尔CPU的强大算力,为大模型视频训练提供了成本效益高的预处理方案。抖音集团视频架构负责人王悦强调,该方案在算法和工程上的优化,提升了模型训练效率,实现了处理链路的高效协同。 此外,火山引擎还推出了跨语言同声复刻直播方案、多模态视频理解与生成方案、对话式AI实时交互方案和AIG3D大场景重建方案,全面覆盖音视频生产、交互到消费的各个环节。这些方案不仅提升了用户体验,也为内容创作者提供了新的工具和平台。 火山引擎视频云负责人Yongyuan指出,火山引擎通过整合豆包大模型和AI能力,实现了音视频全链路的升级,为企业提供了解法,以应对AI视频时代的变革和挑战。
|