谷歌实验室近日测试了一款名为Whisk的新型图像生成器,该工具突破了传统文本提示的局限,允许用户通过图像来激发创意,混合生成全新的照片。Whisk的核心功能在于其能够结合三张不同的图片——分别代表主体、场景和风格——以创造出独一无二的视觉作品。
利用谷歌的Imagen 3图像生成模型,Whisk能够识别并融合每张图片的关键特征,实现用户对图片主体、背景和艺术风格的个性化定制。例如,用户可以将自己的肖像作为主体,选择一个未来派的城市景观作为背景,再添加一幅动漫风格的图片来定义整体的艺术风格。
此外,Whisk还支持文本提示功能,用户可以通过输入具体描述来进一步细化生成的图像,如“主体骑着飞行自行车”等细节。尽管如此,由于Whisk主要关注每张图片的几个关键特征,生成的结果可能并不总是完全符合用户的预期。谷歌提醒用户,可以查看和编辑底层提示以优化结果。
目前,这项实验性功能仅对美国用户开放,他们可以通过访问labs.google/whisk来尝试这一创新工具。Whisk的推出,不仅为图像创作带来了新的可能性,也为人工智能在艺术创作领域的应用开辟了新天地。
|
声明:
本站所有内容来源于用户上传,用来分享交流。如有资料或者图片不小心侵权,请发邮件(41835170@qq.com)告知!