在6月5日的智谱AI Open Day上,智谱AI宣布了一项重大消息——全模型矩阵降价,其中GLM-4-Flash模型的价格降至0.06元/百万Tokens。
降价详情如下: - GLM-4-Air、GLM-3-Turbo:现价0.6元/百万Tokens
- Embedding-2:现价0.3元/百万Tokens
- GLM-4-Flash:现价0.06元/百万Tokens
此外,智谱AI还开源了GLM-4-9B系列模型,这一系列包括基座模型、视觉模型以及不同上下文长度的Chat模型。GLM-4-9B-Chat模型提供的功能包括多轮对话、网页浏览、代码执行和自定义工具调用等,支持26种语言,包括日语、韩语和德语。
官方宣称,GLM-4-9B及GLM-4-9B-Chat在语义、数学、推理、代码和知识等多方面的数据集测评中表现出超越Llama-3-8B的性能。同时,该模型还具备网页浏览、代码执行、自定义工具调用和长文本推理等高级功能。 GLM-4V-9B模型在1120*1120高分辨率下的中英双语多轮对话能力,在多模态评测中表现出超越GPT-4-turbo-2024-04-09、Gemini 1.0 Pro、Qwen-VL-Max和Claude 3 Opus的性能。
自2023年3月14日开源ChatGLM-6B以来,GLM系列模型受到了广泛关注和认可。经过近半年的探索,GLM技术团队推出了第四代GLM系列开源模型:GLM-4-9B。在预训练方面,引入了大语言模型进入数据筛选流程,获得了10T的高质量多语言数据,是ChatGLM3-6B模型的3倍以上。同时,采用了FP8技术进行高效的预训练,训练效率提高了3.5倍。
GLM-4-9B模型具备了更强大的推理性能、更长的上下文处理能力、多语言、多模态和All Tools等能力。系列模型包括基础版本GLM-4-9B(8K)、对话版本GLM-4-9B-Chat(128K)、超长上下文版本GLM-4-9B-Chat-1M(1M)和多模态版本GLM-4V-9B-Chat(8K)。
GLM-4-9B模型的具体性能如下: - 基础能力:中英文综合性能相比ChatGLM3-6B提升了40%,在AlignBench、IFeval、Natural Code Bench等方面取得了显著提升。
- 长文本能力:上下文从128K扩展到了1M tokens,能处理约200万字的输入,相当于两本《红楼梦》或125篇论文的长度。
- 多语言能力:支持26种语言,tokenizer词表大小扩充至150k,编码效率提高了30%。
- Function Call能力:相比上一代提升了40%,在Berkeley Function-Calling Leaderboard上与GPT-4不相上下。
- All Tools能力:模型能够理解和使用一系列外部工具来辅助完成任务。
- 多模态能力:GLM-4V-9B模型能够处理高分辨率输入,并通过降采样技术有效减少了token的开销。
通过这些技术升级,GLM-4-9B系列模型在多模态任务中展现了显著的优势,尽管参数量仅为13B,但性能与GPT-4V不相上下。智谱AI的这一开源举措,将进一步推动AI技术的发展和应用,为用户带来更加丰富和高效的AI体验。
|