谷歌发布新一代开放模型系列Gemma 3：高性能与小体积的融合

小哪吒

Gemma3_KeywordBlog_RD3_V01b.width-2200.format-webp.webp

谷歌宣布推出Gemma 3，这是一款基于Gemini 2.0技术打造的轻量级、最先进的开源模型系列。Gemma 3专为在设备上快速运行而设计，从手机、笔记本电脑到工作站，开发者可以在任何需要的地方创建AI应用。该模型系列提供1B、4B、12B和27B等多种尺寸，以满足不同硬件和性能需求。

      Gemma 3在性能上表现出色，其在LMArena排行榜的初步人类偏好评估中超越了Llama-405B、DeepSeek-V3和o3-mini等模型，成为单加速器上表现最佳的模型。它支持超过140种语言，具备先进的文本和视觉推理能力，能够分析图像、文本和短视频，为互动和智能应用开辟新可能。此外，Gemma 3还提供128k标记的上下文窗口，能够处理和理解大量信息，并支持函数调用和结构化输出，助力自动化任务和代理体验的构建。为提升性能，Gemma 3还推出了量化版本，在保持高准确率的同时，降低了模型大小和计算需求。
      在安全性方面，Gemma 3的开发经过了严格的数据治理、与谷歌安全政策的对齐微调以及全面的基准评估。随着模型能力的增强，谷歌特别针对其在制造有害物质方面的潜在滥用风险进行了评估，结果显示风险水平较低。与此同时，谷歌还推出了基于Gemma 3的ShieldGemma 2，这是一款强大的4B图像安全检查器，能够为图像应用提供内置安全保护，输出危险内容、色情和暴力三个安全类别的标签，开发者可根据自身需求进行定制。
      Gemma 3和ShieldGemma 2能够无缝集成到现有工作流程中。它们支持Hugging Face Transformers、Ollama、JAX、Keras、PyTorch、Google AI Edge、UnSloth、vLLM和Gemma.cpp等多种工具，开发者可根据项目需求灵活选择。用户可以在Google AI Studio中即时访问Gemma 3并开始构建，也可通过Kaggle或Hugging Face下载模型。Gemma 3还提供优化的代码库，包含高效的微调和推理配方，开发者可以使用Google Colab、Vertex AI或游戏GPU等平台进行训练和适配。此外，Gemma 3支持多种部署选项，包括Vertex AI、Cloud Run、Google GenAI API、本地环境和其他平台，能够与NVIDIA GPUs、Google Cloud TPUs以及AMD GPUs通过开源ROCm™堆栈进行优化集成，还提供Gemma.cpp以支持CPU执行。