谷歌推出高效小型AI模型Gemma-2-2B

小哪吒

谷歌DeepMind近日发布了其开源语言模型家族Gemma 2的最新成员——Gemma-2-2B。这款仅有20亿参数的小型模型在性能上实现了突破，展现出与大型模型匹敌甚至超越的能力。

据谷歌介绍，Gemma-2-2B在LMSYS聊天机器人竞技场排名中的表现优于部分GPT-3.5级别的大型模型，包括Mixtral-8x7B。更引人注目的是，它甚至超越了拥有700亿参数的LLaMA-2-70B，后者的参数量是Gemma-2-2B的35倍。

Gemma-2-2B的高效性使其能在更广泛的低功耗设备上运行，为AI应用提供了更多可能性。它与此前发布的90亿和270亿参数版本的Gemma 2一起，构成了一个全面的模型家族。

为提高AI安全性，谷歌同时推出了基于Gemma 2的内容过滤分类器ShieldGemma。这套分类器旨在检测和缓解AI输入输出中的有害内容，如仇恨言论、骚扰、色情材料和危险内容。ShieldGemma提供了20亿、90亿和270亿参数三个版本。

此外，谷歌还发布了Gemma Scope工具，旨在增加AI决策过程的透明度。该工具可帮助研究人员更好地理解Gemma-2模型如何识别模式、处理信息和做出预测。

Gemma-2-2B现已在Kaggle、Hugging Face和Vertex AI Model Garden等平台上线，用户可在Google AI Studio或免费版Google Colab中试用。ShieldGemma和Gemma Scope也已免费开放使用。

谷歌DeepMind此次发布的Gemma-2-2B代表了语言模型发展的新趋势：在保持高性能的同时，通过提高效率来降低资源需求。这一进展有望推动AI技术在更多领域的广泛应用。