上海无问芯穹智能科技有限公司旗下的Infini-AI异构云平台近日取得重要进展,成功实现DeepSeek-R1大模型在壁仞、海光、摩尔线程、沐曦、昇腾、燧原、天数智芯等七家国产硬件平台上的便捷部署与推理服务。这一成果不仅展示了无问芯穹在软硬协同提升算力利用效率方面的技术实力,也为国产芯片生态建设注入了强大动力。
DeepSeek-R1通过模型结构、算子、通信和硬件等多层面的优化,实现了性能突破与算力成本压缩。无问芯穹的第三代大模型推理系统采用计算分离与存储融合设计,显著降低了首Token延迟和每个Token的生成延时,提升了模型在同等算力条件下的表现。此次优化进一步推动了“国产模型×国产系统×国产芯片”的AI产业链闭环建设,为开发者提供了高效、统一的模型部署方案,屏蔽了底层硬件差异,激发了更多下游应用场景的生态建设。
无问芯穹Infini-AI异构云平台致力于连接多种模型与芯片,提供高性能算力和原生工具链,助力大模型全生命周期的降本增效。目前,用户可通过平台获取DeepSeek-R1与DeepSeek-V3模型的对话体验与API调用服务,并可选择不同规格的并发服务包以满足企业级稳定应用需求。
|
声明:
本站所有内容来源于用户上传,用来分享交流。如有资料或者图片不小心侵权,请发邮件(41835170@qq.com)告知!