当前位置:»资讯 AI新闻 全球AI最前线

[行业动态] 智谱 AI 全面降价:GLM-4-Flash降至 0.06 元 / 百万Tokens,并宣布GLM-4-9B 开源

640.webp

在6月5日的智谱AI Open Day上,智谱AI宣布了一项重大消息——全模型矩阵降价,其中GLM-4-Flash模型的价格降至0.06元/百万Tokens。

降价详情如下:
  • GLM-4-Air、GLM-3-Turbo:现价0.6元/百万Tokens
  • Embedding-2:现价0.3元/百万Tokens
  • GLM-4-Flash:现价0.06元/百万Tokens

此外,智谱AI还开源了GLM-4-9B系列模型,这一系列包括基座模型、视觉模型以及不同上下文长度的Chat模型。GLM-4-9B-Chat模型提供的功能包括多轮对话、网页浏览、代码执行和自定义工具调用等,支持26种语言,包括日语、韩语和德语。

官方宣称,GLM-4-9B及GLM-4-9B-Chat在语义、数学、推理、代码和知识等多方面的数据集测评中表现出超越Llama-3-8B的性能。同时,该模型还具备网页浏览、代码执行、自定义工具调用和长文本推理等高级功能。
6407.webp

GLM-4V-9B模型在1120*1120高分辨率下的中英双语多轮对话能力,在多模态评测中表现出超越GPT-4-turbo-2024-04-09、Gemini 1.0 Pro、Qwen-VL-Max和Claude 3 Opus的性能。

自2023年3月14日开源ChatGLM-6B以来,GLM系列模型受到了广泛关注和认可。经过近半年的探索,GLM技术团队推出了第四代GLM系列开源模型:GLM-4-9B。在预训练方面,引入了大语言模型进入数据筛选流程,获得了10T的高质量多语言数据,是ChatGLM3-6B模型的3倍以上。同时,采用了FP8技术进行高效的预训练,训练效率提高了3.5倍。

GLM-4-9B模型具备了更强大的推理性能、更长的上下文处理能力、多语言、多模态和All Tools等能力。系列模型包括基础版本GLM-4-9B(8K)、对话版本GLM-4-9B-Chat(128K)、超长上下文版本GLM-4-9B-Chat-1M(1M)和多模态版本GLM-4V-9B-Chat(8K)。

GLM-4-9B模型的具体性能如下:
  • 基础能力中英文综合性能相比ChatGLM3-6B提升了40%,在AlignBench、IFeval、Natural Code Bench等方面取得了显著提升。
  • 长文本能力上下文从128K扩展到了1M tokens,能处理约200万字的输入,相当于两本《红楼梦》或125篇论文的长度。
  • 多语言能力支持26种语言,tokenizer词表大小扩充至150k,编码效率提高了30%。
  • Function Call能力相比上一代提升了40%,在Berkeley Function-Calling Leaderboard上与GPT-4不相上下。
  • All Tools能力模型能够理解和使用一系列外部工具来辅助完成任务。
  • 多模态能力GLM-4V-9B模型能够处理高分辨率输入,并通过降采样技术有效减少了token的开销。
6402.webp

通过这些技术升级,GLM-4-9B系列模型在多模态任务中展现了显著的优势,尽管参数量仅为13B,但性能与GPT-4V不相上下。智谱AI的这一开源举措,将进一步推动AI技术的发展和应用,为用户带来更加丰富和高效的AI体验。

声明: 本站所有内容来源于用户上传,用来分享交流。如有资料或者图片不小心侵权,请发邮件(41835170@qq.com)告知!
分享到:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

豫ICP备2024052610号-1 ©AI闹海