深度|HeyGen 创始人对话硅谷投资人 Sarah Guo:SaaS 十倍增长背后,Bootstrapping 还是拿融资?
这是 HeyGen 创始人 Joshua Xu 与硅谷知名投资人 Sarah Guo 和 Pilot CEO Waseem Daher 最新对谈。
HeyGen 在 3 月底完成 BechMark 领投的 6000 万美元融资,最新估值 4.4 亿美元。Joshua Xu 是 HeyGen 创始人,此前是 Snapchat 担任工程负责人,在 2014 年到 2020 年从事了很多工作,包括广告技术、推荐系统和 AI 驱动的相机技术。2020 年,他创立了 HeyGen ,旨在通过先进的 AI 生成技术改变视觉叙事。
Sarah Guo 是 Conviction 的创始人,专注于投资智能软件,Conviction 也是 HeyGen 的早期投资方。Sarah Guo 此前在 Greylock 担任多年合伙人,是软件、金融科技、安全、基础设施、基础研究和 AI Native 应用领域 40 多家公司的早期投资者或顾问之一。
以下是这次对谈的全部内容:
Waseem Daher
Sarah ,很多人都很好奇,现在 AI 早期创投市场是什么样子?还是像以前一样炙手可热吗?你会如何描述目前的情况?
Sarah Guo
是的,有基本面,然后有供需机制。我创立 Conviction 专注于 AI,因为现在是真正技术和战略变革的时刻。有很多市场是可以抓住的,而在五到十年前是不可能的。这是复合的,你有不断探索新能力、新科学的市场,每天都有学术领域的论文涌现,以及不同团队的探索,这些都很难跟上。然后,从基础设施、工具和应用的开发空间。
我确定大家也对投资者的反应感兴趣。我们在 2022 年 10 月推出了基金,ChatGPT 在那之后成为了一个转折点,就在那个 11 月。
大约三到六个月后开始,你会看到每一个主流 VC 都说,这就是未来,我们认为它会产生巨大的影响。除了一些怀疑论者外,但,市场上 80% 的人已经决定看到了这个机会。
现在你有一系列公司真的在看到用户和商业上的牵引力,比如 HeyGen ,你会看到这方面的复合效应。有很多兴奋和困惑,比如在团队、创始团队和投资者中,关于如何确定投资的力度和投资的方向。对于有着伟大想法的优秀团队来说,肯定是有资金可用的。
Waseem Daher
具体来说, Conviction 对于投资的信心如何?或者也许你们倾向于投资哪些类别?如果我记得正确的话,有六个类别。
Sarah Guo
是的,无论是真实的还是 AI 假设,我都觉得有点尴尬,因为我做了一个演讲,提出了更好地为不同的想法命名的结构。广泛地说,我可以谈谈正在发生变化的一些事情,其中一个现在非常相关,尤其是有机会和 Joshua 一起讨论的是,技能扩展的概念。
如果 HeyGen 让每个人都能进行专业级别的视频制作,那就是一个新的类别、新的能力。这个观众中的大多数人可能对类似 Github、 Copilot 之类的东西很熟悉,或者我们投资组合中有一家公司叫做 Seek,而扩展人们的技术技能,比如编码、数据分析,大多数组织都希望拥有更多这样的技能。
因此,在这些领域,使用变压器和扩散模型实际上可以通过正确的产品和围绕它们的特定培训,导致大量的民主化提升技能。这是我们可以关心的最重要的事情之一,让更多的人能够建立并发挥创造力。
我个人也对应用非常热衷。如果你考虑一下其他的领域,今天我们来探索一下,但我们会看到更多的投资,就在科学领域。我们投资于那些,比如儿童发现,你试图将一些已经在学术研究中某种程度上已经被证明的技术应用到比如结构预测用于药物发现或者不同参数化的领域,这将使你能够进行更便宜和更加有效的药物测试,假设测试,并希望让我们得到更便宜和更有效的药物。
我们会有一些公司真正在应用层面上扩展技能,一些特定领域的公司,比如生物学或机器人技术,任何你可能有一个非常具体的数据获取策略和对领域知识的需求的地方。然后,还有对于较低层次的堆栈的投资,无论是像 Base10 这样的公司,真的帮助我们摆脱硬件管理的 90 年代风格,还是像 Mistral 这样的替代基础模型公司,为核心模型提供一个开放的生态系统,或者像 FreePlay 这样的开发者工具公司。
如果每一个小型和大型企业都试图构建根本上是随机性的应用程序,比如它们是不可预测的,那么你需要有一种系统来评估和监管行为,这在公司中是一种新的能力。因此,我们想要在不同的领域发挥作用。我们一直在关注市场,试图了解我们认为最大的价值创造机会在哪里,但我们认为它是全栈的。
Waseem Daher
有道理。你们两个是如何建立联系的?是 Sarah 还是 Joshua 主动联系的?像这样的投资是怎么发生的?
Sarah Guo
我真的想说我就像每周给 Joshua 发送一个我的 AI 版本的视频,或者像一年一样。那感觉真的很认真。但实际上我们两个都在多伦多的一个活动上, Joshua 之前可能正在与我一起工作的另一位创始人 Linda from Common Room 交谈,我们正在谈论一些 Joshua 正在思考的市场推广挑战。我记得见到 Joshua 觉得这家伙还不错。而且我觉得这听起来好像正在起作用或者开始起作用了,感谢 Joshua 让我们一起合作。
Waseem Daher
那么 Joshua ,你还有其他细节想补充的么?
Joshua Xu
补充的一件事是我长时间都是 Sarah 的《No Prios》播客粉丝,我只是想互相认识一下。
Waseem Daher
你的社交媒体战略有效了,内容创作者身份为你带来了交易流量。
Sarah Guo
是的,希望如此。
Waseem Daher
这是一个长久以来的问题,你们如何看待竞争?特别是我知道 HeyGen 主要是针对一些营销应用的,还有其他一些公司,包括一些得到一流投资者支持的公司,也在瞄准可能类似或相关的市场,也许这里的 TAM 是如此之大,我们只是挠了挠表面,或者你们是如何看待竞争和市场的领域内的老牌公司?Joshua ,我对你作为创始人的观点很感兴趣。
Joshua Xu
首先,竞争是非常令人兴奋的。,这对整个社区来说都是一个非常好的事情。我们互相学习,也互相推动,从彼此那里改进。
我对竞争的看法是,我们需要考虑谁是这场竞争的最终结构。不是我们,有时甚至不是投资者。最终是客户。我要说的是,我们做的一件事是真正专注于获取客户的喜爱,因为他们最终是这场竞争的结构。而且显然, AI 正在爆炸,特别是在早期阶段。
我觉得,快速行动是初创公司唯一的优势。因此,我们会看到,现有的公司都在努力赶上。他们都在努力构建AI应用程序,建立大型模型。我们需要在所有现有公司之前走在前面,然后他们才能解决创新困境。
对于初创公司来说,从我们的角度来看,我们需要考虑的另一件事是,我们的业务模式的长期价值和长期模式是什么?像是网络效应吗?是来自市场战略吗?是来自对 AI 模型的持续改进吗?不同的业务可能会有不同的答案。对于我们来说,我们需要建立一个代理平台,在那里我们可以涵盖很多用例,涵盖很多客户,为客户建立品牌中心。
Waseem Daher
是的,有些道理,可能有些人天真地认为,区别在于基础技术更好,比如模型产生了更好的结果。但从你的观点来看,最终,是如何使其更具吸引力?如何真正嵌入到客户的工作流程中,以至于即使其他人的模型最终也变得很好,仍然非常吸引人,使用你们所构建的东西。
从投资者的角度来看, Sarah ,你是如何思考这个问题的?有人说,这个东西是 GPT 套壳?你是如何看待不是 HeyGen 而是其他业务,比如,关于这些问题在 Twitter 上有很多激烈的辩论。你是如何看待竞争格局的?
Sarah Guo
是的,我有一个偏好,我基本上是一个非常早期阶段的投资者。如果你问大多数投资者,他们会给你一些通用的答案,比如你是投资团队吗?你是投资良好的市场吗?你是投资特定的论点吗?然后,动量有点像是后期的事情。但你可能会有不同的排序。
对我来说,团队始终是第一位的。了解市场、技术、论点是可变的。处于一个好市场总比处于一个不好的市场好。但像伟大的创始人也可以在市场中移动,改变市场的形态。
我会说团队是一切。真正的研究理解,即在机器学习方面创新的能力,以及产品导向、用户导向、真正高速、长期战略思维,以及增长导向的结合是非常罕见的。这对于一个创始团队来说,这是一组很难整合的东西。
从我的 DNA 角度来看,我实际上已经对这个领域进行了一段时间的研究。我对竞争对手比较熟悉。我们看了所有外部可用的数据和一切,但 HeyGen 是这个领域唯一的产品。
我在很多时候是一名 toB 投资者,但我希望从品味的角度来看,我投资的东西都具有 toC 品质。如果你只有 60秒 的时间来吸引某人的注意力,并且它必须是一个良好的体验,那么你是否达到了这个标准,与销售顶层和可以持续多年,具有很好的商业模式,但实际上并不是作为体验质量的高品质的产品相比。
这对于产品体验角度来说也是如此,在模型本身方面也是如此,就像我们刚才所说的,AI GPT与真实 Waseem 一样很多。那些属性的结合是罕见的。我也不会对此抱有宗教信仰,因为不同的市场需要不同的营销策略。
我仍然认为,自下而上的用户如此重要,它是一种不可动摇的优势,虽然它还不足以,但如果你有自下而上的采用,它是难以复制的优势。当我看到所有这些因素,然后在更具战术性的方面,我们正在看网站流量数据,当我们去年夏天投资的时候,海彻处于一个早期的转折点。相对于在这个领域工作的团队,我们相信团队、战略愿景和动量不同。
Waseem Daher
是的,完全有道理。Joshua 你谈到这里的关键之一就是要快速行动。很明显,这是一个团队确实行动迅速的团队。我们的创始人和听众肯定想知道,你们的秘密是什么?你们的策略是什么?如何建立一个高绩效、高速度或高迭代速率的团队和文化?
Joshua Xu
首先,我们每周进行一次发布。这是我们自 18 个月前推出产品以来一直在做的事情。我必须说,坚持每周发布,真的是很具挑战性的,但我们确实非常坚定地保持了这个发布计划。总的来说,我们的一种心态是保持事情非常精简,保持团队非常精简,我们只有 40 个人,真正专注于业务中最重要的事情。
另一个方面就像你提到的,真正建立一个鼓励快速行动的文化。团队中的每个人都应该以同样的方式思考,每个人都应该从同样的角度思考如何解决问题。我们在构建 HeyGen 产品时强调的一点是,我们做事情是迭代的。
我的意思是我们有一个原则。我称之为二八法则,即当你面对问题时,我们总是问自己一个问题,是否有一个解决方案可以解决问题的 80% ?而且这非常快。答案通常是肯定的。那么这就是我们将要采取的方式。
我们首先会发布这个 80% 的解决方案,可能是在一两天内,然后我们会回来。好的,剩下的 20% 仍然是最重要的吗?如果是的,我们将再次应用 80% ,这意味着我们将解决另外 16% 的问题,然后我们继续以此方式迭代。
Waseem Daher
在这种情况下,你们如何发布最高质量的工作?
Joshua Xu
迭代地进行工作实际上是发布最高质量的最佳方式,因为如果不断地应用这个原则三次或四次,它将达到 99%。这是我们在进行发布规划、产品特性测试时一直在做的事情。同样的事情也适用于每一个方面,包括招聘、市场推广,以及基本的搜索。
我要说的最后一件事是非常重要的,真正专注于创业公司的主要事情。通常情况下,你的资源非常有限,团队非常小。你不能真的处理创业环境中的每一件事情。只需将最重要的三件事情列出来,那就是对客户最重要的。我们朝着这个目标努力,为客户改变局面。
Waseem Daher
非常赞同,深深地触动了我的经验,跨越公司的经验,以及我对高绩效团队的看法。你们是如何察觉到达成 PMF ,你们有何感觉?是否有一个时刻你们认为,我们这里有一些神奇的东西?还是说它更多是一个不太具体的过程。Joshua Xu
当你达到 PMF,客户会让你会感受到来自所有客户的强烈市场吸引力。最初当我们构建产品时,我们并没有先构建产品,当我们有了AI演员和人类化身视频的想法时,实际上我们通过在 Fiverr 上发送了一个子示例来验证它。那有点像是演员,但我们没有让观众知道这实际上是 AI。那就是我们识别它的方式。显然,那在 Fiverr 上起作用了,我们意识到了那是市场上的需求,然后我们开始构建产品。
我们也尝试了很多其他的东西,但在开始时, PMF 有点像一门艺术,而不是一门科学。我们几乎开发了一个框架,试图证明这件事不起作用。然后,我们会自然地进行优化和验证。
Waseem Daher
非常有趣。倒置问题会给你不同的视角。我喜欢测试这种情况。就像给人们看失去的视频一样。比如说,首次试点,我们在写任何代码之前的第一件事就是手工进行了一些人们的会计,这是这些 AI 启用的公司的一个很酷的地方。
因此,你实际上可以以一种传统软件公司不可能的方式真正拥有工作产品或解决方案的全部内容,这也是 AI 公司和传统 Saas 模型业务之间的一个有趣区别。Sarah ,你是如何思考 MPV 的?
Sarah Guo
是的,初期对这些公司来说可能会有点不同,因为你需要超过某种质量水平,以便客户使用它。这里有一件有趣的事情是,不同的客户将有不同的客户细分,甚至公司内部的受众将有不同的质量标准。而且一个真正优秀的产品团队也可以塑造产品的其余部分,软件,而不是模型,以使质量对用户来说是可以接受的。
某种程度上。我不知道是否有一个简单的方法来考虑这个问题,但我们只是为每个公司试图服务的每个客户细分和受众,问题是,它是否足够好?产品如何允许优雅的失败?随着产品的改进,它可以为谁提供服务?公司是否能够合理地追求它?
因此,这是一个非常核心的问题。而初创公司有趣的一件事是,在开始时,很多公司都面临着一个鸡生蛋的问题,就像,我知道如何使产品更好。我们只需要去获取一些数据,获取数据是一个重要的战略问题。
我们在研究公司方面欣赏的一点是,它可能需要创造力来找到一种有效利用样本的方式。当人们说像是一个 GPT 套壳,如果你正在使用别人的模型,在建立软件公司方面仍然有很多困难。
Waseem Daher
是的,深感共鸣,建立公司有很多难点,核心技术是其中一个难点,但这绝对不是唯一的难点。
Sarah Guo
完全是。对于不同受众的质量意味着什么,非常诚实地思考是很重要的。即使看视频化身,现在我们看到 HeyGen 的客户将它们用于公开的财报,视频翻译等,对我来说感觉是一个相当敏感的案例。
我没有料到 2024 年会发生这种情况。两三年前,当我开始看这些技术时,我的初步反应是,这是诅咒的。我简直无法相信人们在使用这个,当人们做一些你不期望的事情并为此付费时,你应该有一些好奇心。当团队有这种好奇心时,这是很棒的。
我的困惑是,我觉得我永远不会让这个诅咒的 AI Sarah 走向世界的时候,好吧,如果你的替代品是成千上万美元的视频制作,而作为个人创作者、中小型企业或内部沟通,你都负担得起,那么敏感度会降低,比外部营销低敏感度。
对于某些人来说,它是有意义的,我开始关注这项技术,假设大多数机器学习的东西都在进步。即使今天是诅咒的,也许明天会更好。如果你的团队能够做出好的决策,决定哪些东西会进步,然后像推动信封一样将它们推到一些客户的门槛之上,这是一个巨大的优势。
Waseem Daher
是的,完全有道理。在我们的第一家公司中,我们做了这样一件事,你可以在不重新启动的情况下更新正在运行的系统。最希望它的人是像摩根士丹利这样的金融服务公司,他们的停机时间很昂贵,但是他们永远不会运行由剑桥的一个小公司制作的东西,他们想要从操作系统供应商那里购买。
找到这个 Aha Moment,早期的热情用户,他们痛苦地遇到了问题,他们可以使用当前的东西,然后围绕它建立同心圆,这显然是非常有价值的,这或许是一个我对你有的一个不错的引子。
Joshua ,关于使用 AI 构建和构建智能体,这是否是一个显而易见的选择?你是如何考虑透明度与世界分享建设经验的?如何做出这个决定的?
Joshua Xu
这又回到了初期阶段。首先,我们是第一次创业者,我们来自进入名和研究背景。我们并不一定了解很多关于市场的东西。在开始时,我们应该从杰出的公共社区中学到很多东西。在早期阶段,我们从 0 到 100 万 AI 的故事中分享给了社区,有点像是一种回馈社区的礼物。
我确实觉得,我从这个社区中确实看到了很大的价值,从其他创始人那里学到了很多,从其他构建者那里学到了很多。尤其是在这个 AI 爆炸的时代,有很多东西可以构建,很多东西正在改变,不仅仅是来自客户的互动,也是很多软件业务和市场。
它确实给了我们很多,它促使我们对客户做出承诺,并对社区做出承诺,告诉他们我们的进展,以及社区给了我们很多动力和灵感,我们很乐意回馈社区。
Waseem Daher
很酷。Sarah ,这件事是否吸引了你的注意?或者这是否根本不是一个因素?你也很早就投资了。
Sarah Guo
这是在公司找到初步 PMF 后的事情。我确实读过 Joshua 发表的关于这是如何发生的博客文章。我觉得作为投资者来说,你遇到创始人一次,然后你从创始人那里也知道一些东西,但是在花了 50 分钟与他们交谈之后,你对 HeyGen 或 Joshua 了解多少呢?
所以有一些长期的数据关于人们或正确的人也是非常有用的。如果投资者读到这篇文章,这也是非常好的,超越了基本的社区中心,这对雇主品牌也是非常好的。因为如果人们从你这里学到东西,他们看到了创业历程,他们更可能想成为其中的一部分。
Waseem Daher
是的,有道理。人们喜欢故事情节,这是一种让自己与故事情节联系起来的方式,从根本上讲,这对公司的品牌是有好处的。我真的很喜欢的一件事是, HeyGen 从早期就有收入进来。
我记得在 2022 年 3 月时,大约有 100 万ARR。到 2022 年 10 月,增长了 10 倍左右。到 2023 年,收入大约是 1800~2000 万。显然,这并不妨碍你筹集资金。但是 Joshua ,你是否考虑过 HeyGen 应该更有机地成长?是什么导致你们最终决定拿 VC 的钱?
Sarah Guo
我想简短地补充一下。当我们相遇时, Joshua 并没有在筹集资金,很感谢 Joshua 接受我们的投资,而他更感兴趣的是业务本身。
Waseem Daher
是的,这也是我的观点,你建立了一个能够产生收入的东西,你可以说,让我们保持盈利。我们将从我们为产品赚取的收入中有机地成长,让这个飞轮继续运转。但是你选择了不同的道路。这可能是正确的决定。但我很好奇是什么导致了你的决定,你是如何做出这个选择的?
Joshua Xu
是的,所以我们没有考虑过是否要自给自足还是应该 VC 化业务。实际上。我们主要是思考业务的下一个里程碑以及我们要构建什么?然后找出这些所需要发生的事情。
显然,不同阶段的不同公司是非常不同的,在提高 PMF 方面,我们确实保持与客户沟通,与客户交谈,这是最需要发生的事情,并保持非常敏捷,一旦我们达到了初步的 PMF ,那时是几百万 ARR。
我还记得,当我们遇到 Sarah 时,我们的规模还不到今天的 10%。显然,在那个时候,我们正在努力弄清楚整个市场导向,当我们有了 PMF 时,我们如何开始扩张,投资者会提供不同的东西,资源和资金是一个方面。
另一件事是,他们提供的帮助和建议以及,围绕不同专业知识产生的。然后我们选择与 Sarah 合作的原因是因为,我们可以从市场导向方面得到很多支持和帮助。以后的阶段,我们将需要真正加深在周围的研究和周围,我们如何实际上成为更好的模型,创造更好的体验。这也会改变对话,再次改变对话,我们是否需要更多资源,我们是否需要更多 GPU 计算?我们真的没有把收入看作是主要的里程碑。
我们一直希望把我们的使命与众人共享,让每个人都能享受视觉故事。我真的觉得我们只是在旅程中走了 5%。你知道我所说的 5%是什么意思,是指还有许多其他的视频创作创新可以借助所有这些新的 AI 技术以生成为基础,我们需要在所有这些新的技术上投入更多的资源。回到上述情况,它真的取决于我们想要达到的里程碑以及实现这些里程碑需要什么。
Waseem Daher
有道理。然后 Sarah ,在你考虑给公司提供建议时,也许 VC 方面的回答是,这是否会成为一个 VC 规模的业务?你如何看待产生收入的公司,以及它们是否应该 Bootstrapping 还是找融资,你认为有很多选择是什么样子的?
Sarah Guo
是的,我觉得 HeyGen 将会成为一个 VC 规模的业务。不那么俏皮地说,我的第一份工作是在家族公司里担任一名不太好的工程师,那是一家在网络基础设施领域的 Bootstrapping 公司,后来上市了。我提到这个是因为他们没有筹集 VC 。实际上,我们尝试过,但失败了,就像都是工程师,里面没有市场人员,也没有故事。
他们最终在收入达到 3000 万并盈利时募集了成长性股权,这是非常不同的。人们说,我看到了财务状况。我真的认为,建立公司有很多不同的方式,但这真正影响了我作为一名投资者的方向,团队仍然必须做所有的工作。但是有一些优势,例如具有一些背景、模型,然后有一大批高质量的人和网络可以,也许会使决策稍微偏向左或右。这很难,但这确实很重要。
Joshua 所描述的取向,只是你试图达到什么目标,然后你是否需要资本?而且,我基本上是社区导向的。或者像需要一个村庄,要建立一个公司,需要很多优秀的人,很难靠自己做到这一点。有些人,有些团队会比其他人走得更远,也许是自己走,也许会选择这样做。
接近问题的一种基本方法是,是否应该 Bootstrapping 公司?如果我的顶级框架是我们有钱或没有钱,那么你将会限制自己的决策范围,只能做一些不需要投资的事情。而你可能想从产品角度来看,这可能非常昂贵。构建更多的东西和为客户提供服务都有固定成本。
这并不是对于最有雄心的公司来说做决策的正确范围。我碰巧也与一些非常资本高效的公司合作,作为一名早期投资者,我有点像普通股东。我们说,不要再稀释了,这更好。如果你能保持下去,这将使你处于独立地位。
收入是一个好的标志,盈利是一个好的标志,但每个人都试图实现的最重要的事情是,净影响和绝对影响,应该根据你试图做什么并从后面开始工作做出决定,而不是像要筹集资金还是不想。
Waseem Daher
是的,我完全同意。把话题转给观众提问 —— 有一个问题, Joshua ,你谈到的起源故事是说,我们发现了这个很酷的东西,我们现在有了这个技术,让我们去找一个应用,还是反过来的方式,即我看到了这个市场问题,我觉得我可以解决它。让我们看看是否能开发出这个技术?
Joshua Xu
是的,实际上,都不是。最初的故事是,我之前在 Snapchat 工作过,找到了 HeyGen 之前,Snapchat 使用了大量的 AI 来增强摄像头体验。在早期,可能是滤镜,迪士尼的设计滤镜之类的。那是在 2018 年,那是我第一次看到计算机可以生成一些在现实中不存在的东西。我当时就对此感到非常着迷,它开始显示,技术或机器学习可以实际上创造一些内容,那是非常早期的感受。
在那个时候,我花了很多时间,早期的日子里我只是觉得这个东西可能会改变人们将来创造内容的方式,但那是超级早期的,早于我们甚至有一个叫 Jennifer AI 的词。我们在创业之前没有看到市场上的机会,这更像是我们有一个愿景,我们想要让每个人都能用视觉叙事来讲故事,使之变得更容易。
最初的故事是, Snapchat 是一个摄像头公司,每个人都通过手机摄像头创作内容。但我们看到,仍然有数百万人无法用摄像头创造好的内容,好的视频。他们如何能够访问视频创作,使用像 HeyGen 这样的工具呢?这就是我们最初考虑它的方式,然后我们逐渐找到了这个愿景的方向。
我们现在应该怎么做才能给客户带来价值呢?这就是让我们进入这个世界的方式,我们想要首先解决的是摄像头在业务角色中的问题。在能够生成箭头之后能够进行 AI 配音,然后逐渐我们想要构建端到端的解决方案,为整个视频生成集成所有的英雄元素。
Waseem Daher
很酷。关于你看到的最多的牵引力的行业,就像有多少是早期采用者,某种意义上显然是,但也有一些可能是像真的老派行业吗?实际上有一些意想不到的细分用例,或者关于早期客户是什么样子的,是否有什么令人惊讶的事情?
Joshua Xu
首先, HeyGen 是一个非常水平的产品,这是产品战略的一部分。我们几乎每次都会看到新的用例。一个例子是,就像 Sarah 提到的,我们没有想到实际上有些公司会用 HeyGen 来制作他们的结束成本视频。那是一个很棒的用例,因为在那种情况下,那段内容可以用不同的语言达到不同的受众,还有一些其他的在主要来自许多关于市场营销和销售领域,人们真的想要通过视频格式提升和提升内容的地方。
Waseem Daher
这个问题也许是问你们两个的。你们认为在视觉生成 AI 方面的下一个领域是什么?是更多像这样的东西,非常高质量的人类化身吗?还是还有其他的,你们对解决的下一个问题非常兴奋?当你们考虑未来五年时,技术已经取得了一些进步。有没有特定的用例,你们认为会变得非常普遍,或者你们非常兴奋地解锁,那种视觉叙事空间。
Joshua Xu
总的来说,趋势是两个方面。在整个视频生成空间,一个是文本到视频的空间,我们可以从头到尾生成整个视频。另一部分也很有前途,正在发生。那就是如何将视频组装在一起?
我们真的是这样想的,每次一家公司想制作一个视频时,通常他们会去找一个视频编辑器或代理商。我们会确定风格,观看视频并看视频,并且代理商会制作一个新视频。
我们实际上会给予帮助,将以前制作过的过去视频内容放在一起,这是我们想要保持一致的品牌风格。然后问题就是,我们能不能用 AI 复制整个过程呢?这是非常可行的,因为所有这些元素都能够理解品牌、视觉风格、色调、品牌风格、颜色或这方面的元素。
这是另一条解决视频生成问题的途径。想象一下,我们有一个 AI,就像视频代理和视频编辑那样,可以自动完成所有的事情以及我们想要的。
Waseem Daher
很酷。这是很明智的,很明显它将是多么有用,只是考虑一下我们生产的东西。更一般地说, Sarah ,我们迄今为止谈论的内容是否有一个你最感兴趣的前沿领域,还是在另一个领域?
Sarah Guo
我们对许多不同的领域都感到兴奋,我在公司中提到了一个与我们迄今为止讨论的创意领域有关的领域,还有一个不同的领域。真的很有教育意义的是,成为一个投资者或者像一个团队,你实际上是规模部署的,因为用户会告诉你很多东西,特别是即使是非技术的或技术的用户。当
我从一个 HeyGen 用户那里学到他们希望产品能做些什么时,我感到最惊讶。当然了。他们就像 Joshua 可以提到的那样,但如果是,我期待你能够识别和生成特定的方言,或者音乐、跳舞,行走的视频?我需要像这样的两个人在这个采访格式中,看起来完全像这个买家一样。
这很棒,因为客户会推动你变得更加雄心勃勃。然后你会独立地更有雄心勃勃,而不是纯粹的做实验或学术研究。就像我喜欢 Sora 团队正在做的工作,像 Pika 这样的公司,看到人们试图从头开始生成各种各样的视频场景。
看到人们实际上想要制作的东西,与我们完全可以从模型的世界观中创造的东西不同。有很多方面,首先,这是有趣和悲伤的,但是有一个充分的理由。今天孩子们的第一目标是成为 YouTube 创作者。世界上有很多对视频创作的需求,但因为每个人都想变得更好,所以未被满足。对吧?视频,这是非常有趣的。
我们做这个播客,没有先验条件,我们与我们认为有趣的人交谈,有时是创始人,有时是大公司 CEO,有时是研究人员。但我们与一些领先的研究人员谈话,他们基本上说视频有所有这些未解决的问题,而且实际上是因为很多技术原因太难了。很多看起来太难的事情实际上并不是,社区中有更多聪明的人在解决它们。
我感到有些羞愧地说这句话,因为在 Greylock 待了十年,我是普通的抱怨者之一,就像许多其他主要 VC 公司一样,你看到消费者硬件和机器人技术等领域的东西,传统上是一种很好的方法,就是说只是因为它也很难可能。你会失去很多钱,因为它也是非常困难的。
也许我会很天真地告诉自己,这一次情况不一样。但我会找到一些理由,至少有更高效的数据收集,更有效的政策应用,以及可能会产生需要新硬件的全新体验的原因。
像今天的软件开发人员一样,你可以创建一个完全不同的体验吗?如果你提供了关于你在世界上看到的和听到的所有事情的被动信息,那么是的,我可以给你带来新鲜的体验,这是你手机上不可用的。而且你可能会以不同方式设计硬件。我不知道是否会立即发生,但我比以往任何时候都更乐观。
本文由人人都是产品经理作者【江天 Tim】,微信公众号:【有新Newin】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。
题图来自Unsplash,基于 CC0 协议。
- 目前还没评论,等你发挥!