如何冷静看待视频大模型Sora?

0 评论 2341 浏览 3 收藏 5 分钟

Sora出现之后,许多人都在思考它会对影视行业或者其他行业带来什么影响。这篇文章里,作者分享了他对Sora的观察和思考,一起来看一下。

我对sora的观察思考都在这里:

1.Sora刚出来的时候,看到最多的词汇是“王炸”,“视频行业完蛋了”,“人类的落日”。在我看来,这绝对不是王炸,最多是“四个3”,因为这仅仅是开端,让大家过过瘾,实际投入生产和商业化的路还很长,另外按照OpenAI的风格,现在酝酿着更强大的可以投入生产的能力。

2.为什么说是一个开端,未来是什么样子?如果我是视频生产者,我的使用场景是,投喂几个图片或视频元素,按照我意愿生成一个完整的视频,比如全员会的开场视频,需要有公司的logo,有虚拟公司吉祥物的形象,甚至有高管的发言。又比如做一个产品宣传视频,需要把我们产品的界面照片输入进去,比如学习机,自动生成一个学习机的宣传视频。

如果Sora能够做到这一步,原本制作视频的成本是10天,压缩成2个小时,才是颠覆行业,视频从业者的落日。

但现在已经看到Sora的能力,他的描述能力,也就是把脑海中想象的画面通过文字具象化的能力,很多人类是不具备这种能力的。所以要达到上面说的场景, 只是时间问题。

3.Sora仅仅具备描述能力,缺少的是想象力和共情能力。所以靠想象力产生价值的工作长期还无法取代,比如演员,我们看电影,看的是演员的微表情,性格特征,从而共情,比如贾玲的坚韧,沈腾经历坎坷的逆风翻盘,没有赛车手经历的韩寒拍不出《飞驰人生》。

所以说替代影视行业,时间尚早。冷静对待自媒体的夸张表达。

4.Sora不是第一个生成视频的工具,他为什么会火?

从我目前的观察来看,生成视频的质量最好。体现在这几个点:

第一时间比较长,长达1分钟的超长视频,内容长度远远高于市面上的AI视频模型。60秒达到了抖音快手的内容要求;

第二视频内容的连贯性,其他生成的视频二维效果较好,但是对三维空间以及物体应如何交互没有内在的理解,导致AI视频往往会出现人物扭曲和变形。Sora生成的视频一镜到底,视频中的舞龙,背景人物,都达到了惊人的一致性,各种镜头随意切换,人物都是保持了极高的稳定性。

第三是细节表现,人物的眼睫毛惟妙惟俏,舞狮画面狮头的麒麟随风摆动。

5.有的公司假期还没结束,还没有正式上班,就开始行动了,重点讨论Sora的产品布局。对于组织和个人来说,想抓住这波机会,至少先关注再尝试,且不能忽视。借用一句话,先看见,再相信。

6.Sora对教育产品有什么影响?或许伪直播,录播课是不是都可以成为过去式了?

只需要知识点的输入,就能生成一个生动形象的而且是真实的主讲老师讲课视频。

对于教研老师的能力或许是操控AI的能力了。

说到最后,人类远古经历石器时代、青铜时代、铁器时代。有的工具在人类手上始终是静止的工具,有的工具在人类手上变成神奇的魔法棒。

作者:灵魂工程,微信公众号:灵魂工程(linghun1949)

本文由@灵魂工程 原创发布于人人都是产品经理。未经许可,禁止转载

题图来自 Sora 官网演示视频截图

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!