用嘴做视频真来了！Meta 这个新应用太逆天了 | 人人都是产品经理

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

注册 | 登录

用嘴做视频真来了！Meta 这个新应用太逆天了

2022-10-08

4 评论 3773 浏览 7 收藏

B端产品经理需要进行售前演示、方案定制、合同签订等，而C端产品经理需要进行活动策划、内容运营、用户激励等

技术的发展已经极大地突破了人们的想象边界，并将以往只存在于脑海中的功能付诸现实。比如最近 Meta 推出的 Make-A-Video，就可以直接用文字生成视频，实现“用嘴做视频”的效果。那么这一产品功能最终呈现的效果如何？一起来看看作者关于它的解读吧。

今年，是 AI 在图像视频制作领域进步很大的一年。

有人拿着 AI 生成的图像拿走了数字艺术大奖，战胜了一众人类艺术家；有 Tiktok 这样的应用通过文字输入生成图片，变为短视频的绿幕背景；还有新的产品可以做到文字直接生成视频，直接实现「用嘴做视频」的效果。

这次的产品来自深耕人工智能多年，前段时间才因为元宇宙被疯狂嘲讽的 Meta。

只是这次，你不能嘲讽它了，因为它真的有了小突破。

一、文字转视频，能做成什么样

现在，你可以动嘴做视频了。

这话虽然有点夸张，但 Meta 这次推出的 Make-A-Video 恐怕真是朝着这个目标前进的。

用嘴做视频真来了！Meta 这个新应用太逆天了

目前 Make-A-Video 可以做到的是：

文字直接生成视频——将你的想象力变成真实的、独一无二的视频；
图片直接转为视频——让单一图片或两张图片自然地动起来；
视频生成延伸视频——输入一个视频创建视频变体。

单说文字直接生成视频这个方面，Make-A-Video 就战胜了不少专业的动画设计专业的学生。至少它什么风格都能做，而且制作成本非常低。

虽然官网还不能让你直接生成视频体验，但你可以先提交个人资料，之后 Make-A-Video 有任何动向都会先和你分享。

目前可以看到的案例不多，官网展示的案例在细节上还有一些怪异的地方。但不管怎么说，文字可以直接变视频，本身就是一个进步了。

一只泰迪熊在画自画像，你可以看到小熊的手在纸面阴影部分的投影不太自然。

用嘴做视频真来了！Meta 这个新应用太逆天了

机器人在时代广场跳舞。

用嘴做视频真来了！Meta 这个新应用太逆天了

猫拿着电视遥控器换台，猫咪手部爪子和人手极为相似，某些时候看还觉得有点惊悚。

用嘴做视频真来了！Meta 这个新应用太逆天了

还有戴着橙色针织帽的毛茸茸树懒在摆弄一台笔记本电脑，电脑屏幕的光映在它的眼睛里。

用嘴做视频真来了！Meta 这个新应用太逆天了

上面这些属于超现实风格，和现实更相似的案例则更容易穿帮。

Make-A-Video 展示的案例如果只是专注局部表现都不错，例如艺术家在画布上画画的特写，马喝水，在珊瑚礁游泳的小鱼。

用嘴做视频真来了！Meta 这个新应用太逆天了

用嘴做视频真来了！Meta 这个新应用太逆天了

用嘴做视频真来了！Meta 这个新应用太逆天了

但是稍微写实一点的年轻夫妇在大雨中行走就很怪异，上半身还好，下半身的脚忽隐忽现，有时还会被拉长，如同鬼片。

用嘴做视频真来了！Meta 这个新应用太逆天了

还有一些绘画风格的视频，宇宙飞船登陆火星，穿着晚礼服的夫妇被困在倾盆大雨中，阳光洒在桌上，会动的熊猫玩偶。从细节上看，这些视频都不够完美，但仅仅从 AI 文字转视频的创新效果来看，还是让人惊叹的。

用嘴做视频真来了！Meta 这个新应用太逆天了

用嘴做视频真来了！Meta 这个新应用太逆天了

用嘴做视频真来了！Meta 这个新应用太逆天了

用嘴做视频真来了！Meta 这个新应用太逆天了

静态的油画也可以在 Make-A-Video 帮助下动起来——船在大浪中前进。

用嘴做视频真来了！Meta 这个新应用太逆天了

海龟在海中游动，最初的画面非常自然，后面变得更像绿幕抠图，不自然。

用嘴做视频真来了！Meta 这个新应用太逆天了

瑜伽训练者在朝阳中舒展身体，瑜伽垫也会随着视频的变化一起变化——这个 AI 就战胜不了学习影视制作的学生了，控制变量没做好。

用嘴做视频真来了！Meta 这个新应用太逆天了

最后输入一个视频模仿其风格创造视频变体也有 3 种案例。

其中一个变化相对来说没那么精致。宇航员在太空中飘舞的视频变为了美感稍弱版本的 4 个粗放版视频。

用嘴做视频真来了！Meta 这个新应用太逆天了

小熊跳舞的视频倒是有不少令人惊喜的变化，至少舞姿有变化了。

用嘴做视频真来了！Meta 这个新应用太逆天了

至于最后兔子吃草的视频就是最「安能辨我是雌雄」的类型了，5 个视频最后很难认出谁是初始视频，看着都蛮和谐。

用嘴做视频真来了！Meta 这个新应用太逆天了

二、文字转图片刚有进展，视频就来了

在《阿法狗之后，它再次彻底颠覆人类认知》中，我们曾经介绍过图像生成应用 DALL·E。曾有人用它制作出的图像去和人类艺术家 PK并最终取胜。

现在我们看到的 Make-A-Video 可以说是一个视频版本的 DALL·E（初级版）——它就像 18 个月前的 DALL·E，有巨大突破，但现在的效果不一定能让人满意。

甚至可以说，它就是站在巨人 DALL·E 肩膀上做出成就的产品。相较于文字生成图片，Make-A-Video 并没有在后端进行太多全新变革。

研究人员在论文中也表示：「我们看到描述文本生成图片的模型在生成短视频方面也惊人地有效。」

目前 Make-A-Video 制作的视频有 3 个优点：

加速了 T2V 模型（文字转视频）的训练；
不需要成对的文本转视频数据；
转化的视频继承了原有图像/视频的风格。

这些图像当然有缺点，前面提到的不自然都是真实存在的。而且它们不像这个年代诞生的视频，画质模糊，动作僵硬，不支持声音匹配，一段视频长度不超过 5 秒，解析度 64 x 64px 都是硬伤，它们的清晰度远远不够。

用嘴做视频真来了！Meta 这个新应用太逆天了

这个视频狗狗舌头和手有几帧非常怪异

几个月前清华大学和智源研究院（BAAI）研究团队发布的第一个能根据文本直接合成视频的 CogVideo 模型也有这样的问题。它基于大规模预训练的 Transformer 架构，提出了一种多帧率分层训练策略，可以高效的对齐文本和视频片段，只是也经不起细看。

但谁能说 18 个月后，Make-A-Video 和 CogVideo 制作的视频不会比大部分人更好呢？

目前已经发布的文字转视频工具虽然不多，但在路上的却有不少。在 Make-A-Video 发布后，初创企业 StabilityAI 的开发者就公开表示：「我们的（文字转视频应用）会更快更好，适用于更多人。」

有竞争才会更好，越来越逼真的文字转图像功能就是最好的证明。

作者：冷思真

来源公众号：爱范儿（ID：ifanr）；连接热爱，创造不同。

本文由人人都是产品经理合作媒体 @爱范儿授权发布于人人都是产品经理，未经许可，禁止转载。

题图来自Unsplash，基于CC0协议

该文观点仅代表作者本人，人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

报道未来，服务新生活引领者。

260篇作品 1835006总阅读量

前置路由，让收银台丰富多样

12-293034 浏览

前置路由，让收银台丰富多样

淘宝重大调整后，有商家冲上单品“已售100万+”

10-094178 浏览

淘宝重大调整后，有商家冲上单品“已售100万+”

UI转产品，涨薪30%，只需90天：我的成功之路

刚刚

电商年货节哪家强？我们扒了淘宝、京东、抖音和快手的数据

01-302544 浏览

电商年货节哪家强？我们扒了淘宝、京东、抖音和快手的数据

谈谈营销的逻辑

08-2512620 浏览

谈谈营销的逻辑

普通人想通过抖音赚钱要先知道这4点

12-264080 浏览

普通人想通过抖音赚钱要先知道这4点

评论

从世界路过

这个算法实现有点难吧？

最近来自浙江回复
快乐的鸡蛋黄

震惊，马上打算去试一试，虽然还没有特别智能但是这个表现形式真的很厉害

最近来自广东回复
小唯

只有想不到，没有做不到；牛

最近来自广东回复
之桃

这次真的是大惊喜啊，虽然细节方面有点问题，但文字能转视频就是一大进步了

最近来自广东回复

案例分析：同样是B端产品经理，为什么你接定制化需求这么难？

找到设计机会点——汽车充电平台调研分析报告

11-164437 浏览
从濒临破产到玩具王者，乐高的翻盘离不开这些“超级用户”

11-103967 浏览
超5亿人“上头”，“抖快号”和“爱优腾”再战微短剧

10-311384 浏览

12032人已学习13篇文章

如何做好年终总结？

2023年已结束，你的年终总结写好了吗？本专题的文章分享了如何做好年终总结。

12673人已学习13篇文章

如何做好用户流失预警？

在用户运营中，拉新往往要比做好用户留存所花费的成本要高，但有各种各样的原因会让用户在某个过程中流失掉，应当如何规避与注意呢？本专题的文章分享了如何做好用户流失预警。

13854人已学习12篇文章

人力资源管理系统的设计指南

人力资源管理系统，帮助企业管理和维护其人力资源。本专题的文章分享了人力资源管理系统的设计指南。

13313人已学习12篇文章

如何做知识管理？

知识管理是什么？通常来看，想理解知识管理，可以从业务、管理、实施等视角切入。本专题的文章分享了如何做知识管理。

12282人已学习12篇文章

如何构建UGC社区？

构建UGC社区是很多社区平台的必经之路，它能助力平台内容生产，为社区提供活水源泉。本专题的文章分享了如何构建UGC社区。

19660人已学习13篇文章

中台基础知识了解

什么是中台？为什么要建中台？中台建设的切入点在哪？本专题的文章将提供这些问题的解答。