2025年1月20日,杭州深度求索人工智能基础技术研究有限公司宣布正式发布DeepSeek-R1模型,并同步开源模型权重。这一举措不仅展示了DeepSeek在人工智能领域的技术实力,也为行业带来了新的发展动力。
DeepSeek-R1在后训练阶段大规模应用了强化学习技术,即便在标注数据稀缺的情况下,也能显著提升模型的推理能力。在数学、代码和自然语言推理等任务上,DeepSeek-R1的性能与OpenAI o1正式版相当,展现了其强大的技术优势。此外,DeepSeek还开源了基于R1蒸馏的6个小模型,其中32B和70B模型在多项能力上达到了OpenAI o1-mini的水平。
为了推动开源社区和行业生态的发展,DeepSeek在协议授权层面进行了调整。开源仓库统一采用MIT License,完全开源且不限制商用,无需申请。同时,线上产品用户协议也明确允许用户通过模型蒸馏等方式训练其他模型,进一步促进了技术的共享与创新。
DeepSeek-R1的API服务定价为每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens 16元。用户可以通过登录DeepSeek官网或官方App,开启“深度思考”模式,调用R1完成各类推理任务。详细的API调用指南可在官方文档中查阅。
|
声明:
本站所有内容来源于用户上传,用来分享交流。如有资料或者图片不小心侵权,请发邮件(41835170@qq.com)告知!