智谱 AI 全面降价：GLM-4-Flash降至 0.06 元 / 百万Tokens，并宣布GLM-4-9B 开源

小哪吒

在6月5日的智谱AI Open Day上，智谱AI宣布了一项重大消息——全模型矩阵降价，其中GLM-4-Flash模型的价格降至0.06元/百万Tokens。

降价详情如下：

GLM-4-Air、GLM-3-Turbo：现价0.6元/百万Tokens
Embedding-2：现价0.3元/百万Tokens
GLM-4-Flash：现价0.06元/百万Tokens

此外，智谱AI还开源了GLM-4-9B系列模型，这一系列包括基座模型、视觉模型以及不同上下文长度的Chat模型。GLM-4-9B-Chat模型提供的功能包括多轮对话、网页浏览、代码执行和自定义工具调用等，支持26种语言，包括日语、韩语和德语。

官方宣称，GLM-4-9B及GLM-4-9B-Chat在语义、数学、推理、代码和知识等多方面的数据集测评中表现出超越Llama-3-8B的性能。同时，该模型还具备网页浏览、代码执行、自定义工具调用和长文本推理等高级功能。

GLM-4V-9B模型在1120*1120高分辨率下的中英双语多轮对话能力，在多模态评测中表现出超越GPT-4-turbo-2024-04-09、Gemini 1.0 Pro、Qwen-VL-Max和Claude 3 Opus的性能。

自2023年3月14日开源ChatGLM-6B以来，GLM系列模型受到了广泛关注和认可。经过近半年的探索，GLM技术团队推出了第四代GLM系列开源模型：GLM-4-9B。在预训练方面，引入了大语言模型进入数据筛选流程，获得了10T的高质量多语言数据，是ChatGLM3-6B模型的3倍以上。同时，采用了FP8技术进行高效的预训练，训练效率提高了3.5倍。

GLM-4-9B模型具备了更强大的推理性能、更长的上下文处理能力、多语言、多模态和All Tools等能力。系列模型包括基础版本GLM-4-9B（8K）、对话版本GLM-4-9B-Chat（128K）、超长上下文版本GLM-4-9B-Chat-1M（1M）和多模态版本GLM-4V-9B-Chat（8K）。

GLM-4-9B模型的具体性能如下：

基础能力：中英文综合性能相比ChatGLM3-6B提升了40%，在AlignBench、IFeval、Natural Code Bench等方面取得了显著提升。
长文本能力：上下文从128K扩展到了1M tokens，能处理约200万字的输入，相当于两本《红楼梦》或125篇论文的长度。
多语言能力：支持26种语言，tokenizer词表大小扩充至150k，编码效率提高了30%。
Function Call能力：相比上一代提升了40%，在Berkeley Function-Calling Leaderboard上与GPT-4不相上下。
All Tools能力：模型能够理解和使用一系列外部工具来辅助完成任务。
多模态能力：GLM-4V-9B模型能够处理高分辨率输入，并通过降采样技术有效减少了token的开销。

通过这些技术升级，GLM-4-9B系列模型在多模态任务中展现了显著的优势，尽管参数量仅为13B，但性能与GPT-4V不相上下。智谱AI的这一开源举措，将进一步推动AI技术的发展和应用，为用户带来更加丰富和高效的AI体验。