揭秘Midjourney的两大功能碰撞
Midjourney这一产品,相信大多数人都不陌生了,这篇文章里,作者就介绍了Midjourney的两个功能,分别为sref和cref,一起来看看它们的工作原理和功能应用吧。
Midjourney是一个强大的文本到图像的人工智能模型,它允许用户通过输入文本提示来生成独特的图像。Midjourney使用两种不同的参考方式来帮助用户控制图像的生成:sref和cref。
下面来分别介绍下–sref和 –cref的区别和使用方法(注意:–cref和–sref目前只适用于 niji 6 和 v6 模型。)
一、sref功能介绍
sref(style reference)是一种参考方式,它允许用户指定一个或多个图像作为风格参考。Midjourney将使用这些参考图像来帮助生成具有类似风格的图像。
sref风格介绍
sref可以用来控制图像的整体外观和感觉。例如,你可以使用sref来生成具有以下风格的图像:现实主义、超现实主义、抽象主义、表现主义、印象派、野兽派、立体主义、达达主义、超现实主义、波普艺术。
二、cref功能介绍
cref(content reference)是一种参考方式,它允许用户指定一个或多个图像作为内容参考。Midjourney将使用这些参考图像来帮助生成具有类似内容的图像。
cref的工作原理与垫图(image prompt)较为相似,都比较注重图片特征,不过最大的区别是sref生成的是相同风格,垫图是基础创作。
cref风格介绍
MJ官方表示cref这个功能更适合用于动漫或游戏,相对来说人物不大适用与真实照片cref可以用来控制图像中包含的内容。例如,你可以使用cref来生成包含以下内容的图像:动漫及游戏人物、动物、植物、风景、建筑、交通工具、食物、物品。
三、cref基础使用方法
首先我们点击左上角➕上传一张或多张图像,这里我们选择的用人物图像去生成,选图需注意:选择一张清晰、正脸或者侧脸、光线较好、最好不遮挡五官的真人肖像照片作为角色参考,点击发送,用imagine输入提示词和尺寸后加上–cref URL 并输入图片的地址,再使用 –cw 来调试参数配置,切记–cref 目前只适用于 niji 6 和 v6 模型。
默认的参数是100(–cw 100),如果追求与图片相似度极高可将参数调(–cw 80到–cw 100),如想更加贴合关键词描述生成,可拓展性更强些可将参数调(–cw 0到–cw 30),–cref对人物发饰和服饰还原度能更高些不过对于面部、五官并不能百分百的还原,不过办法总比困难多,经过反复测试我发现可以通过对该图的面部特征进行详细描述还是可以有效提升人物的面部相似度。
此外参考图像的质量对生成图像的质量有很大的影响。因此,在选择参考图像时,请务必选择高质量的图像。高质量的图像应该具有以下特点:
- 高分辨率
- 清晰锐利
- 光线充足
- 没有模糊或失真
cref实例
(–cw0)时
The girl wearing a denim suit tied a ponytail –ar 9:16 –cref https://s.mj.run/s9ahb_ilI0s –v 6.0 –cw 0
(–cw50)时
The girl wearing a denim suit tied a ponytail –ar 9:16 –cref https://s.mj.run/s9ahb_ilI0s –v 6.0 –cw 50
(–cw100)时
The girl wearing a denim suit tied a ponytail –ar 9:16 –crefhttps://s.mj.run/s9ahb_ilI0s–v 6.0 –cw 100
关键词翻译:穿牛仔套装的女孩扎着马尾辫
不难发现(–cw 0)时生成的图像虽然还原度不是很高不过对关键词的描述还是很精准的。(–cw 100)时生成的图像还原度虽然很高不过对于关键词的提炼不够精准。(–cw 30到–cw 60)相对来说无论对图像的还原度还是对关键词的可控性能都能较稳定些。
四、sref基础使用方法
跟cref使用的方式相似首先我们点击左上角➕上传一张或多张图像,这里我们选择自己喜欢风格的图像去生成,比如赛博朋克风、波点风、像素风等,然后点击发送,用imagine输入提示词和尺寸后加上–sref URL 并输入图片的地址,切记–sref 目前只适用于 niji 6 和 v6 模型。
1. Sref高阶使用的方法
与cref步骤保持一致,只不过要在输入图片地址后面再使用 –sw 来调试参数配置,默认的参数是100(–sw 100),如果想关闭可将参数调至0(–sw 0),如果想将风格最大的强度还原可将参数调至1000(–sw 1000)。
2. Sref实例
(–sw100)时
Girl, wearing a beret, a windbreaker, cool boots, holding a baseball bat in hand –ar 9:16 –srefhttps://s.mj.run/KG-wdaBGNdo–v 6.0 –sw 100
(–sw500)时
Girl, wearing a beret, a windbreaker, cool boots, holding a baseball bat in hand –ar 9:16 –srefhttps://s.mj.run/KG-wdaBGNdo –v 6.0 –sw 500
(–sw0)时
Girl, wearing a beret, a windbreaker, cool boots, holding a baseball bat in hand –ar 9:16 –srefhttps://s.mj.run/KG-wdaBGNdo –v 6.0 –sw 0
关键词翻译:女孩子戴上贝雷帽身穿风衣,穿着炫酷的靴子手拿着棒球棒
(–sw 0)时生成的图像风格还原度不是很高不过对关键词的描述还是很精准的。(–sw 100)和(–sw 500)时生成的图像不但风格还原度很高同时也能对于关键词的提炼更加够精准。
五、cref与sref结合实例
Cyberpunk style, girl, wearing beret, windbreaker, cool boots, holding baseball bat in hand –ar 9:16 –crefhttps://s.mj.run/s9ahb_ilI0s–v 6.0 –cw 20 –sw 500 –srefhttps://s.mj.run/KG-wdaBGNdo
关键词翻译:赛博朋克风格,女孩戴贝雷帽身穿风衣,酷靴,手里拿着棒球棍
首先我们点击左上角➕上传一张或多张人物图像然后再上传一张参考风格的图像点击发送,用imagine输入提示词和尺寸后加上–cref URL 并输入人物图片的地址,再使用 –cw 来调试人物参数配置,再把参考风格的图像链接放入,再加上–sw调节风格的参数即可。上图是我测试的一个案例,整体效果还是非常不错的。
今天的分享到这里就结束了,总的来说sref和cref功能还是很强大的,需要大家多去练习,才能灵活运用到自己的工作场景中~
作者:张俊枫
来源公众号:58UXD(ID:i58UXD),58UXD,全称58同城用户体验设计中心。
本文由人人都是产品经理合作媒体 @58UXD 授权发布。未经许可,禁止转载。
题图来自 Unsplash,基于CC0协议。
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
- 目前还没评论,等你发挥!