谷歌DeepMind近日宣布推出其AI模型的最新版本——Gemini 2.0 Flash Experimental。这款新一代AI模型在多模态功能上进行了显著改进,能够处理文本、图像、视频和音频,并原生生成图像及多语言语音。Gemini 2.0的推出,标志着谷歌在人工智能领域的进一步深入。
Gemini 2.0 Flash Experimental目前已在网络聊天应用程序中上线,并通过Google AI Studio和Vertex AI中的Gemini API供开发人员和选定测试人员使用。谷歌计划在2025年初发布更广泛的版本。新版本将被集成到谷歌AI概览中,以处理更复杂的主题和多步骤问题,包括高级数学方程式、多模态查询和编码挑战。
在性能方面,Gemini Flash 2.0的运行速度是前身Gemini 1.5 Pro的两倍。尽管在基准测试中与Anthropic的Sonnet“3.6”相当,但考虑到成本效益,Gemini Flash 1.5可能更具价格优势。谷歌强调,基准测试性能并不总是等同于实际性能。
此外,谷歌正向所有Gemini用户推出聊天优化版Gemini 2.0 Flash Experimental,并计划未来集成移动应用程序。对于开发者,谷歌计划将Gemini 2.0集成到Android Studio、Chrome DevTools和Firebase等多个平台,并在Visual Studio Code、IntelliJ和PyCharm等流行集成开发环境中提供增强的编码支持。
谷歌还推出了三个研究原型,展示Gemini 2.0的代理功能。Project Mariner是一款实验性Chrome扩展程序,专为基于Web的任务设计,实际测试场景中成功率达到83.5%。第二个代理Jules专注于通过GitHub工作流集成为开发人员提供支持。目前,Jules仅适用于一组选定的测试人员。
谷歌此前宣布的Project Astra将充分利用Flash的速度和多模式功能,这款通用AI助手可以进行多语言对话,并具有长达十分钟的上下文记忆。该系统与Google搜索、Lens和地图集成,提供全面的帮助。
在数据科学领域,谷歌正在升级其现有的Google Colab数据科学代理,以使用Gemini 2.0。该代理能够根据用户描述自动生成分析,显著缩短分析时间。有兴趣测试该代理的开发人员可以提交访问请求。
谷歌DeepMind还在视频游戏中测试Gemini 2.0,其中代理通过分析屏幕内容为玩家提供实时战略建议。此外,公司还计划在机器人应用中测试该模型增强的空间推理能力。
最后,谷歌为Gemini Advanced订阅用户推出了“深度研究”功能,这项基于代理的新功能可自动执行复杂搜索并快速生成综合报告,将谷歌的搜索技术与Gemini的分析功能相结合。
|
声明:
本站所有内容来源于用户上传,用来分享交流。如有资料或者图片不小心侵权,请发邮件(41835170@qq.com)告知!