Stable Video零基础使用教程及应用案例
前些时间,Stable Video 开放公测,这篇文章里,作者就分享了他的体验过程和应用实例,并将 Stable Video 与Runway、PixVerse、Pika 做了对比分析,一起来看看作者的梳理。
上周 Stable Video 开放公测,可以生成4s视频,我第一时间体验了一波。
相比 Sora 可生成60s 多角度多机位多角色的视频, Stable Video 效果没有那么惊艳。但是相比市面上主流的AI视频Runway、pika等还是有一定优势的,下文中我也会进行效果对比。
目前 Stable Video 对所有用户都可以免费开发,每天可领150积分,图生视频每使用一次消耗10积分,文生视频消耗11积分,还可以付费升级。
接下来让我们一起来试一试吧。
一、初步体验
1. 登录网址
打开官网:https://www.stablevideo.com/
进入 Stable Video 主页,点击图片上蓝色的「Start with image」按钮或者白色的「Start with text」按钮,就会跳转到 Stable Video 的主操作界面啦。
2. 主操作界面
操作界面很简洁,顶部为「两种指令场景」,分别为图生视频、文生视频。
中间为输入文字或上传图片的区域,跟runway界面类似。
二、文生视频创作
1. 写提示词
输入提示词「A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors.」(一部电影预告片,讲述了这位30岁的太空人的冒险故事,他戴着红色羊毛针织摩托车头盔,蓝天,盐沙漠,电影风格,用35毫米胶片拍摄,色彩生动。)
这次我使用 sora 相同的提示词进行对比,看看 Stable Video 生成的效果,更多 Sora 视频可查看我的主页。
2. 选择尺寸和风格
输入提示词后,可以选择比例和想要的画面风格,这边我选择默认的 16:9 ,比例有三种尺寸分别为:16:9、9:16 和 1:1。
Stable Video 提供十七种风格可供选择,这边给大家全部列出来,真实电影感以及适合动画的风格化效果还是很丰富的。这次我选择「Analog Film (胶片)」风格效果。
3. 选择图片
等待一会,会像 Midjourney 一样会生成4张图片,选择一张你喜欢的继续生成视频。可以看到提示词中「戴着红色羊毛针织摩托车头盔」没有识别出来,「蓝天,沙漠,电影风格,用35毫米胶片拍摄」都表现的很不错,其中我选择的风格参数「胶片感」表现的也很好,整个生成的图片质量很高,果然 Stable.AI 很强。
4. 生成视频与sora对比
刚开放测试出视频很慢,可能会直接挂掉,所以,心态要崩住。下面看一下 Stable Video 给我们生成的4秒视频,与王者 sora 相同关键词生成的17s视频做一个对比(官网素材)。
5. 多种风格测试
使用相同提示词测试不同风格的文生视频效果如下。第一组「粉色豹子」「a jaguar walking through a pink forest, in the style of nightmarish illustrations, dark black and green, detailed illustrations, fluorescent colors 」提示词过于细致,出的图片质量效果很高,但是对于各种风格表现差异不大,生成视频多倾向提示词中的豹子行走的视频,视频在后期崩的情况较多。
第二组提示词提示词我就选择了较为简单的「海豚,大海」,风格效果就更为明显,同样也是在海豚动态效果较为明显的时候视频容易崩,仅仅是镜头移动和环境移动画面更稳定。
三、图生视频创作
1. Midjourney出图
首先,在Midjourney中生成需要「宇航员」图片。接下来我们就实际体验一下图生视频的步骤和方法。
2. 点击按钮
在主操作界面中,可以选择直接上传图片,把我们的「宇航员」图片上传进来。
3. 选择参数
Stable Video 提供很多相机的运动参数,比如倾斜、旋转、平移、镜头推进等,根据需要选择运动镜头。
4. 生成视频
基本参数对比:
这边我测试了同个「宇航员」图片情况下,选择 Stable Video 相机运动的不同参数的生成效果。分别为:锁定 (Locked)、抖动 (Shake)、向下 (Down)、旋转 (Orbit)、平移 (Pan)、变焦 (Zoom in)。画面主体人物基本没有变化,在整体画面和背景发生了相应的镜头变化。生成的6个视频,可以更好的理解以上几种镜头运动效果。
四、Stbale Video、Runway、Pika、PixVerse 对比
春节时候用 Runway、PixVerse、Pika 做了一个视频《恭喜发福》,图片都是Midjourney 做的图,可以看到下面跑的图。接下来使用相同图片试一下 Stbale Video 的效果。
首先,先对比主流的几款AI视频软件一些基础参数,每个都有自己的特点,这些AI视频我之前也都有写一些操作教程。
运动强度对比:
在 Stbale Video 镜头 Locked 参数下,选择运动强度数值为 127、190、以及最大的数值255,测试不同的效果如下。运动强度数值为127时,画面基本上动作微小,255数值最大时后面1秒直接模糊崩坏,190数值效果最为稳定幅度适合。
1. Stbale Video与PixVerse对比
当时在使用PixVerse时候做的效果和现在使用Stbale Video制作的效果对比。PixVerse也可以设置画面运动幅度,我设置过5、7、10的效果。这次选择PixVerse motion5,和Stbale Video Motion 190做对比。效果都很好,画面没有出现崩坏的效果,Stable Video 效果画质更加稳定清楚。
2. Stbale Video与Pika对比
Stable Video和pika这组效果,同时是镜头推进拉伸,Stable Video画面稳定性更强,pika由于角色比较多画面中角色的脸直接崩了。
3. Stbale Video与Runway对比
最后一组测试是Stable Video和Runway。由于我希望画面中的财神摆出恭喜发财的手势,由于Stable Video目前只有镜头参数,没有更多功能,所以使用Runway的运动笔刷更具有优势,可以直接涂抹要修改的地方,把方向更改向下,就出现恭喜发财的手势了,效果还不错。
当然 Stable Video 有时候也有翻车的时候,毕竟目前AI绘画和AI视频还是像抽卡。
五、后记
实话实说,抛开王者 Sora 不说,Stable Video 基于的画面稳定性和画质细节都很强,目前每天可领150积分,简直是大羊毛赶紧薅。而且文生视频效果也很强。当然几款主流的AI视频软件 Runway、Pika、Stable Video 各有各自的优势,配合midjourney 的王炸组合还是要大家自己结合使用。
本文由 @yaoyao 原创发布于人人都是产品经理,未经作者许可,禁止转载。
题图来自Unsplash,基于CC0协议。
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
- 目前还没评论,等你发挥!