Meta 以 Llama 3 405B 挑战 OpenAI 的 GPT-4o,这是其迄今为止最大的开源 LLM。
Meta 发布了开源 Llama 语言模型系列迄今为止最大的模型:Llama 3.1 405B,拥有 4050 亿个参数。
整个 Llama 3 系列也已更新至 3.1 版本,与4 月份发布的 Llama 3 型号相比,它支持 8 种语言,并且上下文长度显著扩展至 128,000 个标记。
据 Meta 介绍,Llama 3.1 405B 是首个开源的前沿级 AI 模型,在常见基准测试中,无论是英语任务还是需要掌握多种语言的任务,其表现都优于 GPT-4o 和 GPT-4 的早期版本,与Anthropic 的 Claude 3.5 Sonnet也处于同一水平。 较小的 3.1 Llama 模型具有 700 亿和 80 亿个参数,使用 405B 模型生成的数据进行了优化,至少与同类开源模型和 GPT-3.5 Turbo 相当,后者最近被功能更强大、更便宜的 GPT -4o mini所取代。 虽然这些基准测试结果表明 Llama 3 405B 与商用机型基本相当,但实际性能可能会有所不同。
Meta 还在发布的同时推出了新的安全工具,包括用于输入和输出审核的 Llama Guard 3、用于快速注入保护的Prompt Guard 和用于网络安全风险评估的 CyberSecEval 3。
Meta 发布最大的 Llama 模型(含代码和权重) ,允许在Llama 许可下进行商业使用。该模型可以细化、提炼为其他模型,其生成结果可用于 AI 训练。Meta 已建立广泛的合作伙伴生态系统来部署和优化 Llama 3。 只有拥有超过 7 亿用户的公司才需要获得 Meta 的商业许可。鉴于 Meta 已投资数十亿美元开发和训练其 AI 模型,该公司为什么要这样做呢?
该公司可能希望吸引开发者加入其自己的“AI 生态系统”,就像谷歌对 Android 所做的那样。Meta 还将这些模型集成到自己的 AI 产品中,例如其“Meta AI”助手。随着社区改进模型,Meta 的产品也将得到改进。
Meta 还在一定程度上破坏了微软、谷歌和其他公司的商业模式,这些公司可能会在人工智能领域超越 Meta,因为它们拥有更好的基础设施和互补的商业模式,比如云增长。但目前,它对 OpenAI 以及更普遍意义上的纯模型提供商的打击最为严重。
Meta 首席执行官马克·扎克伯格在一封公开信中大力提倡开源人工智能,并将其比作 Linux 取代封闭的 Unix 系统。他预测,像 Llama 这样的开放模型将从明年开始引领行业,因为它们具有适应性和成本效益。
扎克伯格写道:“去年,Llama 2 仅与落后的上一代车型相当。今年,Llama 3 可以与最先进的车型相媲美,并在某些领域处于领先地位。从明年开始,我们预计未来的 Llama 车型将成为业内最先进的车型。”
如果技术上可行,Llama 3 的发布可能会促使 OpenAI 和其他公司更快地推出更强大的模型。然而,语言模型的最新进展是渐进式的,忽略了成本和效率优势,而 Llama 3 似乎并没有为人工智能行业当前的圣杯带来重大进步:将逻辑推理与大型多模态模型的知识和语言能力相结合。
|