Reka发布多模态大模型Reka Core，可与 GPT-4V和Claude 3 Opus媲美

小哪吒

本帖最后由小哪吒于 4-16 23:51 编辑

4月15日，AI初创公司Reka（https://www.reka.ai/）推出了一种名为Reka Core的多模态大模型，可与业界领先的GPT-4、Claude 3 和 Google 的 Gemini Ultra 等领先模型相媲美。

Reka 是一家人工智能初创公司，专注于通用智能、通用多模式和多语言代理、自我改进人工智能和模型效率，团队成员来自 DeepMind、谷歌、百度和 Meta。

Reka Core从头开始开发仅用了几个月的时间，主要在 NVIDIA H100 GPU 上进行训练，峰值性能约为 2,500 个H100 和 2,500 个 A100 GPU。

性能亮点

Core 在业界公认的关键评估指标上与 OpenAI、Anthropic 和 Google 的模型具有竞争力。考虑到其占地面积和性能，在总拥有成本的基础上，Core 提供了巨大的价值。 Core 的功能及其部署灵活性的结合释放了大量的新用例。

Core 在 MMMU 上与 GPT-4V 相当，在由独立第三方进行的多模态人类评估中优于 Claude-3 Opus，并在视频任务上超越 Gemini Ultra。在语言任务上，Core 在完善的基准上与其他前沿模型具有竞争力。

下表总结了 Core 与当今市场领先型号的比较。

多模态能力评估排名

模型能力

1. 多模态（图像和视频）理解。 Core不仅仅是一个前沿的大语言模型。它对图像、视频和音频具有强大的情境理解能力，是仅有的两种商用综合多模式解决方案之一。

2. 128K 上下文窗口。核心能够摄取并准确地回忆更多的信息。

3. 推理。 Core具有超强的推理能力（包括语言和数学），使其适合需要复杂分析的复杂任务。

4. 编码和代理工作流程。 Core 是顶级代码生成器。其编码能力与其他功能相结合，可以增强代理工作流程。

5. 多语言。 Core 使用 32 种语言的文本数据进行了预训练。它能说流利的英语以及几种亚洲和欧洲语言。

6. 部署灵活性。与我们的其他模型一样，Core 可通过 API、本地或设备上提供，以满足我们的客户和合作伙伴的部署限制。

除了旗舰型号Reka Core之外，该初创公司还推出了较小的型号Reka Flash和Reka Edge。 Reka Flash 拥有 210 亿个参数，更紧凑的 Reka Edge 拥有 70 亿个参数。

Reka 表示，Flash 和 Edge 证明，即使参数少得多，高效的训练和模型架构也能实现最佳性能。这使得它们成为模型大小和推理成本是关键因素的应用程序的替代品，例如在移动设备上。

价格

就价格而言，Reka 最昂贵的 Core 型号远远落后于 Claude 3 Opus，与 GPT-4 Turbo 大致相当。

Reka 核心：

- $10 / 1M 输入代币

- $25 / 1M 输出代币

Claude 3 Opus（来自 Anthropic）：

- $15 / 1M 输入代币

- $75 / 1M 输出代币

GPT-4 Turbo（来自 OpenAI）：

- $10 / 1M 输入代币

- $30 / 1M 输出代币（对于 128K 模型）

[行业动态] Reka发布多模态大模型Reka Core，可与 GPT-4V和Claude 3 Opus媲美