2025年1月22日,北京春田知韵科技有限公司正式推出豆包大模型1.5Pro版本。这一新版本在综合能力、模型结构、多模态能力以及深度思考能力等方面均实现了显著提升,并在全球多项公开评测基准上取得领先。
豆包大模型1.5Pro在知识、代码、推理以及中文能力等多方面表现出色。其采用较小激活参数进行预训练,通过大规模稀疏MoE架构,实现了等效于7倍激活参数的Dense模型性能,远超业内常规效率。同时,自研服务器集群方案大幅降低了硬件成本,自研网卡和网络协议优化了小包通讯效率,确保多机分布式推理的稳定与高效。
在多模态能力方面,豆包大模型1.5Pro的视觉理解能力全球领先。其全新的实时语音模型采用Speech2Speech端到端框架,表现力大幅提升,能够实现情感表达和方言演唱等功能。此外,基于豆包1.5基座模型研发的深度思考模型,在未使用其他模型数据的情况下,通过RL算法突破和工程优化,取得了业内领先的成绩。
|
声明:
本站所有内容来源于用户上传,用来分享交流。如有资料或者图片不小心侵权,请发邮件(41835170@qq.com)告知!