OpenAI发布新一代AI模型o1：推理能力超强，但价格昂贵

小哪吒

本帖最后由小哪吒于 9-13 15:04 编辑

2024年9月12日，人工智能领域的翘楚OpenAI宣布推出其最新研发成果——代号为"Strawberry"的生成式AI模型系列，正式命名为OpenAI o1。这一系列新模型包括通用型o1-preview和专注于代码生成的轻量版o1-mini，将首先在ChatGPT和OpenAI的API中向用户开放。

创新特性与性能提升

o1的最大亮点在于其显著增强的推理能力。OpenAI研究科学家Noam Brown在社交平台X上透露，o1接受了强化学习训练，能够在给出回应前进行"思考"。这种创新方法使o1能够更好地处理复杂任务，如分析法律文件或制定营销策略。

在性能方面，OpenAI声称o1在多项测试中均大幅领先于其前身GPT-4o：

在国际数学奥林匹克(IMO)资格考试中，o1正确解答了83%的题目，远超GPT-4o的13%。

在在线编程挑战赛Codeforces中，o1达到了参与者的第89个百分位。

在数据分析、科学和编码问题上表现更为出色。

多语言处理能力有所提升，尤其在阿拉伯语和韩语等语言方面。

汤森路透副总裁Pablo Arredondo表示，o1在分析法律摘要和解决LSAT逻辑游戏问题等方面的表现优于GPT-4o。

使用限制与成本考量

尽管性能卓越，o1目前仍存在一些局限性：

暂时无法浏览网页或分析文件。

图像分析功能暂时禁用，等待进一步测试。

存在速率限制：o1-preview每周限30条消息，o1-mini每周限50条消息。

响应速度可能较慢，某些查询可能需要10秒以上。

最引人注目的是o1的高昂使用成本。在API中，o1-preview每100万个输入令牌收费15美元，每100万个输出令牌收费60美元，分别是GPT-4o的3倍和4倍。

访问权限与未来规划

目前，只有ChatGPT Plus或Team订阅用户才能在ChatGPT客户端中使用o1。企业和教育用户将于下周初获得访问权限。OpenAI表示计划向所有ChatGPT免费用户提供o1-mini访问权限，但具体日期尚未确定。

OpenAI透露正在探索延长o1推理时间至数小时、数天甚至数周的可能性，以进一步提升其推理能力。

行业影响与挑战

o1的推出引发了业界广泛关注。然而，OpenAI并非唯一一家研究这类推理方法的AI公司。Google DeepMind等竞争对手也在积极开发类似技术。

面对激烈的竞争态势，OpenAI的真正挑战在于如何使o1更加普及和经济实惠。此外，o1在某些情况下可能比GPT-4o更容易产生"幻觉"（即自信地编造信息），这一问题也需要进一步解决。

人工智能技术的飞速发展正在重塑各行各业。o1的问世无疑将为这一进程注入新的动力，但其实际应用效果和对社会的深远影响还有待进一步观察和评估。