谷歌实验室推出Whisk：一款融合三图创意的图像生成器

小哪吒

      谷歌实验室近日测试了一款名为Whisk的新型图像生成器，该工具突破了传统文本提示的局限，允许用户通过图像来激发创意，混合生成全新的照片。Whisk的核心功能在于其能够结合三张不同的图片——分别代表主体、场景和风格——以创造出独一无二的视觉作品。
   利用谷歌的Imagen 3图像生成模型，Whisk能够识别并融合每张图片的关键特征，实现用户对图片主体、背景和艺术风格的个性化定制。例如，用户可以将自己的肖像作为主体，选择一个未来派的城市景观作为背景，再添加一幅动漫风格的图片来定义整体的艺术风格。
   此外，Whisk还支持文本提示功能，用户可以通过输入具体描述来进一步细化生成的图像，如“主体骑着飞行自行车”等细节。尽管如此，由于Whisk主要关注每张图片的几个关键特征，生成的结果可能并不总是完全符合用户的预期。谷歌提醒用户，可以查看和编辑底层提示以优化结果。
   目前，这项实验性功能仅对美国用户开放，他们可以通过访问labs.google/whisk来尝试这一创新工具。Whisk的推出，不仅为图像创作带来了新的可能性，也为人工智能在艺术创作领域的应用开辟了新天地。