谷歌发布Gemini 2.0

小哪吒

   谷歌DeepMind近日宣布推出其AI模型的最新版本——Gemini 2.0 Flash Experimental。这款新一代AI模型在多模态功能上进行了显著改进，能够处理文本、图像、视频和音频，并原生生成图像及多语言语音。Gemini 2.0的推出，标志着谷歌在人工智能领域的进一步深入。
    Gemini 2.0 Flash Experimental目前已在网络聊天应用程序中上线，并通过Google AI Studio和Vertex AI中的Gemini API供开发人员和选定测试人员使用。谷歌计划在2025年初发布更广泛的版本。新版本将被集成到谷歌AI概览中，以处理更复杂的主题和多步骤问题，包括高级数学方程式、多模态查询和编码挑战。
    在性能方面，Gemini Flash 2.0的运行速度是前身Gemini 1.5 Pro的两倍。尽管在基准测试中与Anthropic的Sonnet“3.6”相当，但考虑到成本效益，Gemini Flash 1.5可能更具价格优势。谷歌强调，基准测试性能并不总是等同于实际性能。

    此外，谷歌正向所有Gemini用户推出聊天优化版Gemini 2.0 Flash Experimental，并计划未来集成移动应用程序。对于开发者，谷歌计划将Gemini 2.0集成到Android Studio、Chrome DevTools和Firebase等多个平台，并在Visual Studio Code、IntelliJ和PyCharm等流行集成开发环境中提供增强的编码支持。
    谷歌还推出了三个研究原型，展示Gemini 2.0的代理功能。Project Mariner是一款实验性Chrome扩展程序，专为基于Web的任务设计，实际测试场景中成功率达到83.5%。第二个代理Jules专注于通过GitHub工作流集成为开发人员提供支持。目前，Jules仅适用于一组选定的测试人员。
    谷歌此前宣布的Project Astra将充分利用Flash的速度和多模式功能，这款通用AI助手可以进行多语言对话，并具有长达十分钟的上下文记忆。该系统与Google搜索、Lens和地图集成，提供全面的帮助。
    在数据科学领域，谷歌正在升级其现有的Google Colab数据科学代理，以使用Gemini 2.0。该代理能够根据用户描述自动生成分析，显著缩短分析时间。有兴趣测试该代理的开发人员可以提交访问请求。
    谷歌DeepMind还在视频游戏中测试Gemini 2.0，其中代理通过分析屏幕内容为玩家提供实时战略建议。此外，公司还计划在机器人应用中测试该模型增强的空间推理能力。
    最后，谷歌为Gemini Advanced订阅用户推出了“深度研究”功能，这项基于代理的新功能可自动执行复杂搜索并快速生成综合报告，将谷歌的搜索技术与Gemini的分析功能相结合。