2025年2月27日,腾讯正式发布新一代快思考模型——混元Turbo S。该模型以“秒回”能力为亮点,显著提升了大模型的响应速度,首字时延降低44%,吐字速度提升一倍。与传统慢思考模型不同,混元Turbo S更接近人类的“直觉”决策,适用于通用场景下的快速响应,同时结合慢思考的理性逻辑,为复杂问题提供高效解决方案。
在性能方面,混元Turbo S通过长短思维链融合技术,优化了理科推理能力,整体表现与DeepSeek V3、GPT 4o、Claude等业界领先模型相当。架构上,该模型创新性地采用Hybrid-Mamba-Transformer融合模式,降低了传统Transformer结构的计算复杂度和KV-Cache缓存占用,有效减少了训练和推理成本。这一架构突破了长文训练和推理成本高的难题,同时保留了Mamba处理长序列和Transformer捕捉复杂上下文的优势,成为工业界首个成功将Mamba架构应用于超大型MoE模型的案例。
混元Turbo S的发布不仅降低了大模型的部署成本,还推动了大模型应用的普及。作为腾讯混元系列的核心基座,它将为推理、长文、代码等衍生模型提供基础能力。此外,基于Turbo S,腾讯还推出了深度思考推理模型T1,进一步丰富了模型的应用场景。
目前,混元Turbo S已在腾讯云官网开放API调用,开发者和企业用户可申请免费试用。定价方面,Turbo S输入价格为0.8元/百万tokens,输出价格为2元/百万tokens,相比前代产品大幅下降。腾讯元宝也将逐步上线该模型,用户可在元宝内选择“Hunyuan”模型体验其快速响应能力。
|
声明:
本站所有内容来源于用户上传,用来分享交流。如有资料或者图片不小心侵权,请发邮件(41835170@qq.com)告知!