当前位置:»资讯 AI新闻 全球AI最前线

[行业动态] OpenAI 向开发人员提供据有视觉能力的 GPT-4 Turbo with Vision

一句话概括:现在GPT输入可以加入图片了,但目前只对研发人员通过API形式开放。

WX20240410-225236@2x.png


周二,OpenAI 通过X(以前的 Twitter)帖子宣布,GPT-4 Turbo with Vision(具有视觉功能的最新 GPT-4 Turbo 模型)现已通过 OpenAI API 向开发人员开放。

这个最新模型保留了 GPT-4 Turbo 自 2023 年 12 月起的 128,000 个代币窗口和知识截止。主要区别在于其视觉功能,使其能够理解图像和视觉内容。

在 GPT-4 Turbo with Vision 推出之前,开发人员必须调用单独的文本和图像模型。现在,开发人员只需调用一个可以同时完成这两项任务的模型即可,从而简化了流程,并为广泛的用例打开了大门。  

OpenAI 分享了开发人员已经使用该模型的一些方式,它们非常有趣。

健康和健身应用程序 Healthify 使用带有 Vision 的 GPT-4 Turbo 来扫描用户膳食的照片,并通过照片识别提供营养见解。Make Real 使用 GPT-4 Turbo with Vision 将用户的绘图转换为工作网站。

虽然 GPT-4 Turbo with Vision 模型尚未在 ChatGPT 内或向公众提供,但 OpenAI说它将很快在 ChatGPT 中提供。

声明: 本站所有内容来源于用户上传,用来分享交流。如有资料或者图片不小心侵权,请发邮件(41835170@qq.com)告知!
分享到:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

豫ICP备2024052610号-1 ©AI闹海