转自公众号【赛博大表姐】,非常优秀的博主。 iRAG这个新闻已经不新鲜了,早在上个月这时候,百度世界2024大会上,李彦宏就发布了这项技术。 我是最近在作图的时候偶然想起来了,于是想写一篇,给不了解的朋友们看看。 什么是RAG? Retrieval-Augmented Generation的缩写,检索增强生成。 用通俗易懂的话说,就是解决大模型“胡说八道”的问题,也是我们之前经常说的大模型“幻觉”。
大模型通常会自认为自己回答得还挺对的当它不知道该怎么回答的时候,它也可能会乱回答。
所以之前很多人用AI去写一些学术性的东西,发现这玩意儿根本就没法写,全是胡诌的。
为了解决大模型“幻觉”,行业目前通常用增加RAG,来提高大模型在信息生成中的准确性和实用性。 这次百度发布的是iRAG(image based RAG),可以理解为大模型在图像领域的RAG。 我们先来看一组图: 提示词:特朗普穿圣诞老人的衣服。 提示词:马斯克穿婚纱。 提示词:马斯克穿着宇航服在月球。 人物的脸非常真实,可以说和真人一模一样,而不是像原来那样,看起来像,又不太像…… 百度的iRAG特点:幻觉低、超真实,在影视、漫画、海报制作等应用场景中,有了iRAG的加持,可以大大降低成本。 我刚才说了幻觉低,也不是说这个技术就完全没有幻觉了,在生成一个人的时候还可以,生成2个人幻觉可能就又加重了。 比如这张:
我要的明明是马斯克,生成的图左边是扎克伯克,右边变成了泽连斯基和马斯克的结合体……就很离谱。 最后,说一下怎么用。 手机下载文小言,在对话中选择图片创作,就可以进行绘图啦! 好啦,今天就到这儿吧。散会~
|