智谱AI开放平台今日宣布,GLM-4-Flash模型现已免费向公众开放。用户注册bigmodel.cn后,即可免费构建专属模型和应用。
体验地址:https://bigmodel.cn/console/trialcenter?modelCode=glm-4-flash 模型微调:https://bigmodel.cn/console/modelft/finetuning/create/glm-4-flash 说明文档:https://open.bigmodel.cn/dev/api#glm-4
GLM-4-Flash以其高速和经济性特点,适合快速响应的简单任务。它支持多轮对话、网页浏览、Function Call和长文本推理,覆盖26种语言,包括中文、英语、日语、韩语、德语等,适用于科研数据预处理、信息抽取、多语种翻译、多轮对话等多种场景。
例如,生物学家利用GLM-4-Flash处理分子数据,探索健康密码;开发者使用它生成训练数据,助力其他大模型成长;高校学者制作AI助教,提升学生学习体验;翻译APP开发者利用它帮助儿童进行英语互动学习;广告公司则用它进行文本润色,提高文案产出效率。
智谱AI开放平台相信,GLM-4-Flash的免费开放将激发更多基于大模型的创新应用。
在技术层面,通过自适应权重量化、并行化、批处理策略和投机采样等方法,优化了大模型的运行效率,降低了推理成本。在预训练阶段,引入大语言模型筛选数据,获得了超过10T的高质量多语言数据,是ChatGLM3-6B模型的三倍以上。同时,采用FP8技术,显著提升了预训练的效率。
在逻辑推理能力测试中,GLM-4-Flash完美解决了逻辑推理题,展现了出色的性能。在生成速度方面,GLM-4-Flash达到了72.14 token/s,接近115字符/s,速度仅次于GPT-3.5-turbo。
此外,GLM-4-Flash具备实时网页检索能力,能够快速访问天气、新闻等信息。在函数调用方面,其能力与GPT-4相当。
为鼓励用户反馈,智谱AI开放平台提供限时免费微调福利:完成调查问卷,即可获得500万Tokens(3个月)训练资源包,名额有限,先到先得。
原文地址:https://mp.weixin.qq.com/s/qUcmm060jV6EbLNpHCcG_A
|