谷歌宣布推出Gemma 3,这是一款基于Gemini 2.0技术打造的轻量级、最先进的开源模型系列。Gemma 3专为在设备上快速运行而设计,从手机、笔记本电脑到工作站,开发者可以在任何需要的地方创建AI应用。该模型系列提供1B、4B、12B和27B等多种尺寸,以满足不同硬件和性能需求。
Gemma 3在性能上表现出色,其在LMArena排行榜的初步人类偏好评估中超越了Llama-405B、DeepSeek-V3和o3-mini等模型,成为单加速器上表现最佳的模型。它支持超过140种语言,具备先进的文本和视觉推理能力,能够分析图像、文本和短视频,为互动和智能应用开辟新可能。此外,Gemma 3还提供128k标记的上下文窗口,能够处理和理解大量信息,并支持函数调用和结构化输出,助力自动化任务和代理体验的构建。为提升性能,Gemma 3还推出了量化版本,在保持高准确率的同时,降低了模型大小和计算需求。
在安全性方面,Gemma 3的开发经过了严格的数据治理、与谷歌安全政策的对齐微调以及全面的基准评估。随着模型能力的增强,谷歌特别针对其在制造有害物质方面的潜在滥用风险进行了评估,结果显示风险水平较低。与此同时,谷歌还推出了基于Gemma 3的ShieldGemma 2,这是一款强大的4B图像安全检查器,能够为图像应用提供内置安全保护,输出危险内容、色情和暴力三个安全类别的标签,开发者可根据自身需求进行定制。
Gemma 3和ShieldGemma 2能够无缝集成到现有工作流程中。它们支持Hugging Face Transformers、Ollama、JAX、Keras、PyTorch、Google AI Edge、UnSloth、vLLM和Gemma.cpp等多种工具,开发者可根据项目需求灵活选择。用户可以在Google AI Studio中即时访问Gemma 3并开始构建,也可通过Kaggle或Hugging Face下载模型。Gemma 3还提供优化的代码库,包含高效的微调和推理配方,开发者可以使用Google Colab、Vertex AI或游戏GPU等平台进行训练和适配。此外,Gemma 3支持多种部署选项,包括Vertex AI、Cloud Run、Google GenAI API、本地环境和其他平台,能够与NVIDIA GPUs、Google Cloud TPUs以及AMD GPUs通过开源ROCm™堆栈进行优化集成,还提供Gemma.cpp以支持CPU执行。
|
声明:
本站所有内容来源于用户上传,用来分享交流。如有资料或者图片不小心侵权,请发邮件(41835170@qq.com)告知!