Sora对国内大厂是机会还是挑战？

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

Sora对国内大厂是机会还是挑战？

陆玖财经

2024-02-26

0 评论 4460 浏览 5 收藏

16 分钟

今年开年OpenAI生成新的AI技术——文生视频领域的Sora，这对我们国内大厂的机遇还是挑战呢？让我们来看看作者的分析吧~

抛开技术路线不谈，单就实现效果而言，国内大模型企业们在生成视频方面，是否有着同样的“飞升机会”？

龙年的第一个月，正如去年的ChatGPT，OpenAI开年再出一王炸——文生视频领域的Sora。

面对这样的AI生成能力，包括几乎所有类型的从业者都感受到了不小的震动。一位IT出身的电影制片人告诉陆玖商业评论，Sora的的惊艳表现，让他周围的从业者都有了不小的危机感。电影制作成本的急剧下降，和新锐电影人的出头，将会比以往更加容易。

不过，在面对陆玖商业评论提出的“Sora是否已具备商业化条件”“文生视频对于算力的要求是否更高，以及如何解决”等问题时，这位制片人则用“发展问题，发展解决”的说法给出回复。

这显然过于乐观。毕竟更多从业者认为，从概念到成熟的工业化商用阶段，即便是Sora也有很多不成熟的地方。

也因此，抛开技术路线不谈，单就实现效果而言，国内在文生文等通用模型有相关布局的大模型厂商，是否有着同样的“飞升机会”？文生视频，到底相比过去文生文，有哪些实质性的飞跃？这是一个很有意思的话题。

一、Sora，革命还是泡沫？

必须承认，Sora的出现，让通用人工智能（AGI）的实现，又近了一步。原因在于，它已经做到了模拟真实物理世界的运动，譬如物体的移动与相互作用。不过，仅仅是这种程度的改进，也算不得“惊艳”。根据OpenAI的官方报告，Sora的“革命性”主要体现在下面几点。

首先是时长。作为通用的文生视频大模型，它能根据用户提供的文本描述生成长达60秒的视频，不仅品质上乘，且能更完整准确地还原用户输入的prompt，即提示词。

其次，是在场景的复杂度和角色生成水平的突破。到目前为止，Sora已经能够生成包括多个角色、特定运动类型以及主题精确、背景细节复杂的场景。且镜头语言也开始复杂，这使得视频本身开始具有一定的叙事功能，而这正是目前短视频领域所需要的东西。

再次，除了文本生视频，Sora还能做到从静态图像开始动画化图像，抑或是从已有视频生成新视频，实现填补缺失帧或者延展视频内容的效果。

一位资深科技媒体人对陆玖商业评论表示，Sora这类AI产品的出现，是一种“思维平权”的机会，因为一些长期跟踪行业的科技记者，经常会有一些“脑洞大开”的设想，但没有合适的工具让想法落地。但有了GPT和Sora这类AI工具之后，记者们一旦看到了机会和想法，AI就可能会帮助他实现产品，剩下的就是验证这个产品的可行性。

但陆玖商业评论在与多个行业人士交流以后发现，即便是眼下风光无限的Sora，同样有被高估的可能性。

行行AI董事长李明顺对此较为理性，在他看来，Sora的出现，很大程度上是文生文的通用模型，延展到视频领域的阶段性技术迭代。Sora能有如今的质变，很大程度上也是算力和资金不设上限投入，再加以海量训集的不断重复训练，这是“大力出奇迹”的结果。

相比技术实现上的优越，Sora在“资源禀赋”上的优越，显然跟国内一众“算力荒”厂商拉开了更大的距离。这是国内大模型相关厂商，在相当长时间里难以逾越的鸿沟。

而从投资角度而言，Sora这类垂直领域的“通用模型”也算不得热门标的。

一位一级市场从业者告诉陆玖商业评论，纯一级市场投资，通常只会投资大概念和高估值标的。原因主要在于一级市场的基金存续期是7年，投资期2年，5年退出是大概率事件。但文生视频的垂直模型在5年内能否实现工业化商用，谁都无法下定论。

此外，目前的Sora，所有已知信息只有2月15日发布的技术报告，但在3天后就传出了融资新闻。在没有开放使用、外界不知其实际水平的情况下，在风投公司Thrive Capital牵头融资中，OpenAI的估值已经逼近800亿美元。这位一级市场从业者向陆玖商业评论坦言，这次技术发布很可能是OpenAI“估值管理”的一部分。

昆仑万维的董事长周亚辉在朋友圈表示，“（硅谷）这边的Scientist和工程师根本不认除了Open Al以外的创业公司股票价值，觉得都是纸面财富。宁可要OpenAI.谷歌、FB、微软100万Package(一半股票)的Offer，也不要创业公司300万(80%股票)的Offer。”

可见，Sora之后，OpenAI进一步拉大了与其他AI大厂的差距。

二、国产大模型，厂商们的危与机

尽管Meta、Google以及微软都在蠢蠢欲动，但相较于资本市场对Sora的疯狂，国内大模型厂商则显得冷静得多。国内大厂大多数选择的，仍是立足于自身应用的大模型开发，并非去追求所谓的原生态AI大模型升级。字节即是其中之一，其对于生成式AI的保守态度，早在文生文阶段就已经体现。而从入局时间看，字节并不晚。据晚点报道，2020年6月OpenAI发布GPT-3后，字节曾训练了一个数十亿参数的生成式语言大模型。

如果按部就班开发，到2023年时，字节与OpenAI的GPT，距离不会很远。只是在ROI挂帅的业务体系下，字节这笔投资显然没有算过账来。因此，其在生成式AI的探索上，始终相较竞品慢了一些。

从发布时间来看，百度文心一言于2023年3月份发布，同年10月便迭代至4.0版，紧随其后的是阿里的通义千问、腾讯混元助手，而字节发布云雀大模型的发布时间是2023年8月。

后发导致的结果之一，是用户量不足——文心一言的月活去年就已经破亿，字节的豆包仍然在千万以下。不过，字节在选派张楠执掌剪映之后，有望在生成式AI的进度上更快一点。

如果说字节在文生视频领域暂时没有看到可立即使用的产品，那么百度和阿里则不然。早在去年的百度世界大会上，百度已经演示过文心一言的文生视频能力，主要集成在“一镜流影”插件当中。