Meta 发布迄今为止最强开源大模型：Llama 3.1 405B，拥有 4050 亿个参数

小哪吒

Meta 以 Llama 3 405B 挑战 OpenAI 的 GPT-4o，这是其迄今为止最大的开源 LLM。

Meta 发布了开源 Llama 语言模型系列迄今为止最大的模型：Llama 3.1 405B，拥有 4050 亿个参数。

整个 Llama 3 系列也已更新至 3.1 版本，与4 月份发布的 Llama 3 型号相比，它支持 8 种语言，并且上下文长度显著扩展至 128,000 个标记。

据 Meta 介绍，Llama 3.1 405B 是首个开源的前沿级 AI 模型，在常见基准测试中，无论是英语任务还是需要掌握多种语言的任务，其表现都优于 GPT-4o 和 GPT-4 的早期版本，与Anthropic 的 Claude 3.5 Sonnet也处于同一水平。

较小的 3.1 Llama 模型具有 700 亿和 80 亿个参数，使用 405B 模型生成的数据进行了优化，至少与同类开源模型和 GPT-3.5 Turbo 相当，后者最近被功能更强大、更便宜的 GPT -4o mini所取代。

虽然这些基准测试结果表明 Llama 3 405B 与商用机型基本相当，但实际性能可能会有所不同。

Meta 还在发布的同时推出了新的安全工具，包括用于输入和输出审核的 Llama Guard 3、用于快速注入保护的Prompt Guard 和用于网络安全风险评估的 CyberSecEval 3。

Meta 发布最大的 Llama 模型（含代码和权重），允许在Llama 许可下进行商业使用。该模型可以细化、提炼为其他模型，其生成结果可用于 AI 训练。Meta 已建立广泛的合作伙伴生态系统来部署和优化 Llama 3。

只有拥有超过 7 亿用户的公司才需要获得 Meta 的商业许可。鉴于 Meta 已投资数十亿美元开发和训练其 AI 模型，该公司为什么要这样做呢？

该公司可能希望吸引开发者加入其自己的“AI 生态系统”，就像谷歌对 Android 所做的那样。Meta 还将这些模型集成到自己的 AI 产品中，例如其“Meta AI”助手。随着社区改进模型，Meta 的产品也将得到改进。

Meta 还在一定程度上破坏了微软、谷歌和其他公司的商业模式，这些公司可能会在人工智能领域超越 Meta，因为它们拥有更好的基础设施和互补的商业模式，比如云增长。但目前，它对 OpenAI 以及更普遍意义上的纯模型提供商的打击最为严重。

Meta 首席执行官马克·扎克伯格在一封公开信中大力提倡开源人工智能，并将其比作 Linux 取代封闭的 Unix 系统。他预测，像 Llama 这样的开放模型将从明年开始引领行业，因为它们具有适应性和成本效益。

扎克伯格写道：“去年，Llama 2 仅与落后的上一代车型相当。今年，Llama 3 可以与最先进的车型相媲美，并在某些领域处于领先地位。从明年开始，我们预计未来的 Llama 车型将成为业内最先进的车型。”

如果技术上可行，Llama 3 的发布可能会促使 OpenAI 和其他公司更快地推出更强大的模型。然而，语言模型的最新进展是渐进式的，忽略了成本和效率优势，而 Llama 3 似乎并没有为人工智能行业当前的圣杯带来重大进步：将逻辑推理与大型多模态模型的知识和语言能力相结合。

[行业动态] Meta 发布迄今为止最强开源大模型：Llama 3.1 405B，拥有 4050 亿个参数