法国AI独角兽Mistral 推出大模型微调SDK，让客户可以根据需要微调其模型

小哪吒

6月5日消息，法国人工智能独角兽公司Mistral 发布了一款软件开发工具包 (SDK) Mistral-Finetune，用于在工作站、服务器和小型数据中心节点上微调其模型，以让开发人员和企业针对特定用例微调其生成模型。

在 SDK 的 GitHub 存储库的自述文件中，Mistral 指出，该 SDK 针对多 GPU 设置进行了优化，但可以缩小到单个 Nvidia A100 或H100 GPU，以微调 Mistral 7B 等较小的模型。Mistral 表示，使用 Mistral-Finetune 在八个 H100 上对 UltraChat 等数据集进行微调（UltraChat 是使用 OpenAI 的 ChatGPT 收集的 140 万个对话），大约需要半小时。

对于喜欢更受管理的解决方案的开发人员和公司，Mistral 最新推出的微调服务可通过该公司的 API 获得。目前，该服务兼容Mistral 的两款大模型，即 Mistral Small 和 Mistral 7B，Mistral 表示，微调服务将在未来几周内支持更多大模型版本。

同时，Mistral 推出了定制培训服务，目前仅向特定客户提供，以使用其数据为组织的应用程序微调任何 Mistral 模型。该公司在其官方博客上的一篇文章中解释道： “这种方法可以为其特定领域创建高度专业化和优化的模型。”