谷歌近日宣布将其快速AI模型Gemini 1.5 Flash的价格最高下调78%,同时增加了新的PDF功能,进一步加剧了AI模型市场的价格战。
具体调整如下: - 输入token成本降低78%,至每百万token 0.075美元。
- 对于12.8万token以下的提示,输出token成本降低71%,至每百万token 0.30美元。
- 较长提示和缓存也有类似幅度的降价。
谷歌表示,Gemini 1.5 Flash在需要高速低延迟的场景中最受欢迎,如摘要、分类和多模态理解等。
此外,谷歌还推出了基于文本和图像分析的PDF理解功能,可通过Gemini API和AI Studio使用。对于包含图形、图像等视觉内容的PDF,该模型将使用原生的多模态处理能力。
在语言支持方面,谷歌将Gemini 1.5 Pro和Flash模型的语言支持扩展到100多种,使全球开发者能以自己喜欢的语言使用这些模型。
谷歌还向所有开发者开放了Gemini 1.5 Flash的微调功能。微调允许开发者通过提供额外数据来定制基础模型,提高特定任务的性能。这可以减少提示上下文的大小,降低延迟和成本,并提高模型准确性。
此次价格调整紧随OpenAI近期将GPT-4 API访问价格最高下调50%之后,显示尽管AI模型的开发和运营成本高昂,但提供商们已经陷入激烈的价格战。
|