6月5日消息,法国人工智能独角兽公司Mistral 发布了一款软件开发工具包 (SDK) Mistral-Finetune,用于在工作站、服务器和小型数据中心节点上微调其模型,以让开发人员和企业针对特定用例微调其生成模型。
在 SDK 的 GitHub 存储库的自述文件中,Mistral 指出,该 SDK 针对多 GPU 设置进行了优化,但可以缩小到单个 Nvidia A100 或H100 GPU,以微调 Mistral 7B 等较小的模型。Mistral 表示,使用 Mistral-Finetune 在八个 H100 上对 UltraChat 等数据集进行微调(UltraChat 是使用 OpenAI 的 ChatGPT 收集的 140 万个对话),大约需要半小时。
对于喜欢更受管理的解决方案的开发人员和公司,Mistral 最新推出的微调服务可通过该公司的 API 获得。目前,该服务兼容Mistral 的两款大模型,即 Mistral Small 和 Mistral 7B,Mistral 表示,微调服务将在未来几周内支持更多大模型版本。
同时,Mistral 推出了定制培训服务,目前仅向特定客户提供,以使用其数据为组织的应用程序微调任何 Mistral 模型。该公司在其官方博客上的一篇文章中解释道: “这种方法可以为其特定领域创建高度专业化和优化的模型。”
|