谷歌DeepMind近日发布了其开源语言模型家族Gemma 2的最新成员——Gemma-2-2B。这款仅有20亿参数的小型模型在性能上实现了突破,展现出与大型模型匹敌甚至超越的能力。 据谷歌介绍,Gemma-2-2B在LMSYS聊天机器人竞技场排名中的表现优于部分GPT-3.5级别的大型模型,包括Mixtral-8x7B。更引人注目的是,它甚至超越了拥有700亿参数的LLaMA-2-70B,后者的参数量是Gemma-2-2B的35倍。
Gemma-2-2B的高效性使其能在更广泛的低功耗设备上运行,为AI应用提供了更多可能性。它与此前发布的90亿和270亿参数版本的Gemma 2一起,构成了一个全面的模型家族。 为提高AI安全性,谷歌同时推出了基于Gemma 2的内容过滤分类器ShieldGemma。这套分类器旨在检测和缓解AI输入输出中的有害内容,如仇恨言论、骚扰、色情材料和危险内容。ShieldGemma提供了20亿、90亿和270亿参数三个版本。
此外,谷歌还发布了Gemma Scope工具,旨在增加AI决策过程的透明度。该工具可帮助研究人员更好地理解Gemma-2模型如何识别模式、处理信息和做出预测。
Gemma-2-2B现已在Kaggle、Hugging Face和Vertex AI Model Garden等平台上线,用户可在Google AI Studio或免费版Google Colab中试用。ShieldGemma和Gemma Scope也已免费开放使用。
谷歌DeepMind此次发布的Gemma-2-2B代表了语言模型发展的新趋势:在保持高性能的同时,通过提高效率来降低资源需求。这一进展有望推动AI技术在更多领域的广泛应用。
|