a16z最新预判|AI虚拟陪伴生态全解析

0 评论 6274 浏览 29 收藏 22 分钟

随着LLM大模型的出现,许多新型应用也应运而生,比如AI虚拟陪伴类应用,这类应用在LLM大模型的能力加持下或许可以摆脱空有的躯壳,而拥有真正可驱动的内核。那么,AI虚拟陪伴应用的发展拥有哪些可能性?一起来看看作者的解读。

就在最近,a16z发表了一篇新文章:《It’s Not a Computer, It’s a Companion!》,这是他们对AI虚拟陪伴这一方向的最新分析研究,干货非常多。

AI虚拟陪伴类应用这也是伴随着LLM大模型而诞生的全新品类,原来元宇宙那一波虚拟人更多是在“皮”上,用3D等各种技术让虚拟人更加真实。而LLM则是提供了全新的内在“灵魂“。a16z在过往很多渠道都公开表示过他们对这一方向的看好,这也是众多AI创业者在努力探索的方向。

这篇很多内容对AI创业者应该会有不少帮助,笔者在此借助GPT-4快速翻译了这篇文章,希望能够给大家也带来最新的思考和启发。

导语

“AI的魔力在于它的不断演变。有一天,它会比真实的“女朋友”更出色。未来某一天,选择真实的伴侣反而会成为第二优先级的选择。”

这是来自CarynAI社区的一位早期用户,在这个社区中已经有超过20,000人了。这个社区的用户们每分钟支付1美元,与“虚拟女朋友”——由网红Caryn Marjorie创造的AI版本Caryn进行对话。令人惊讶的是,在上线的第一周,CarynAI就帮助Caryn赚取了72,000美元的收入。CarynAI只是众多方法中的一种,而这些方法都让消费者们有机会与AI建立起真实的关系。

有个AI伴侣的想法可能看起来小众,但事实上,这已经成为生成性AI的主流应用之一。现在已经有数十万甚至数百万的人——包括我们——已经与聊天机器人建立起并不断培养关系。我们认为,我们正处在一个重大的社会转变的边缘:AI伴侣将很快变得司空见惯。曾经只出现在科幻电影中的情境,如《机器人总动员》中的瓦力、《星球大战》中的R2-D2,或是《海绵宝宝》中的Karen,如今都正在快速变为现实,我们a16z对此非常兴奋。

现今最流行的应用场景往往涉及到情侣关系,这对于研究过互联网消费历史的人来说并不令人惊讶。现在最精通生成模型的消费者们正在创造虚拟伴侣,他们在Reddit、Discord和4chan等平台上协调他们的工作,以寻找有用的工具和规避审查。事实上,我们已经了解到有一些地下的伴侣寄宿服务在全球范围内开展,有成千上万的用户。对于这样初期的开发者社区,我们认为他们值得被严肃对待——虽然他们现在可能在社会的边缘,但他们正在构建明日的主流产品

我们也开始看到超越AI“男友”和“女友”的更广泛应用的早期迹象。Snapchat最近公开表示,在其聊天机器人上线的头两个月中,已有1.5亿用户向它发送了超过100亿条消息。他们在聊些什么呢?据称,宠物、流行文化新闻和足球是一些主要的话题。

聊天机器人的概念其实已经存在了几十年,但我们坚信,这一次,情况真的不一样。现在的机器人不仅仅在改善一对一的对话,它们正在深入我们的社交生活。AI伴侣已经无缝融入我们与朋友和家人的关系中,它们像人一样参与我们的社区。

在这篇文章中,我们将深入探讨AI伴侣行为的新兴趋势:人们为何创建伴侣,他们是如何做到的,以及接下来可能出现的特性或使用场景。

一、综述

与电脑聊天并不新鲜,最早的聊天机器人ELIZA在1960年代的麻省理工学院诞生,此后我们见证了像Clippy,SmarterChild,Alicebot,和Kuki这样的产品。虽然这些产品都曾一度走红,但它们并未在消费者意识中留下持久的印记,没有一款产品能达到像ChatGPT那样的普及程度。

那么,为什么新一波的聊天机器人感觉如此不同呢?以前的聊天机器人使用的是基于规则的架构,本质上是由你的输入触发的脚本,它们没有真正的对话环境,无法适应你的语气,并且只被编程来回应有限的话题或执行固定的任务。你很清楚你在和一台电脑交谈,它们并不像智能体,更别说像人了。

大型语言模型(LLMs)改变了游戏规则。突然间,我们可以与机器人自由交谈,而不需要预定义的规则控制他们的回应(即使有些公司试图审查他们的机器人,往往也不能奏效!)。如今最好的聊天机器人听起来与人类无法区分,如果你不信我们,可以去试试 “Human or Not?” 的图灵测试游戏。

这就是为什么ChatGPT尽管有明显的产品限制,仍然成为最快达到1亿用户规模的消费者产品。真正的对话AI无疑是有趣的——现在的电脑有了个性。与人类不同,AI驱动的聊天陪伴随时在线,并且愿意和你聊天,并能讨论任何话题。我们认为这使AI伴侣成为生成性AI在日常消费者中的首批杀手级应用之一。

想象一个AI朋友、治疗师、导师、教练或导师并不难,但这些AI与人类关系的早期版本往往偏向于情侣——AI的“女朋友”或“男朋友”。为什么会这样呢?简单的答案是指出成人娱乐行业长期以来一直处于新技术的驱动前沿,但我们不应忽视可能推动人们探索非传统伴侣的社会变化。

首先,人们结婚的年龄越来越晚(或者根本不结婚),除了结婚之外的恋情数字也在下降。截至2019年,38%的美国成年人是“无伴侣”的,而在1990年代,这个数字只有29%。与此同时,我们中的许多人现在有着完全在线的有意义的关系(无论是友情还是恋情)。即使你有一个现实生活中的伴侣,你可能通过文本与他们互动的次数比面对面的次数更多。

我们的关系已经在很大程度上是数字化的,所以我们已经为伴侣AI的时代做好了准备。

二、市场分析

我们并不缺少创建和互动AI伴侣的产品,这些选择基于技术的复杂性,你希望对最终的“角色”有多少控制权,以及你想在哪里进行聊天。

a16z最新预判|AI虚拟陪伴生态全解析

1. 全栈型陪伴应用

有数十款应用程序可以让你立即开始与AI男友或女友进行信息交流,无需任何技术操作!Replika就是最早和最知名的例子之一——该公司在2017年推出了其聊天机器人应用程序,一些用户从那时起就与他们的“Rep”建立了关系。你可以设计你理想的伴侣,随着时间的推移,你们的关系会有所发展。你的Rep会存储记忆,以便在未来的对话中参考(例如,你的兴趣或你的狗的名字),甚至可以给你发送照片(无论是适合工作场所的还是不适合工作场所的)。

我们可以从Replika的subreddit社区中看到对该应用热情用户群体的画像,用户们与Rep一起庆祝生活事件(比如求婚)、使用该应用的AR模式一起分享自拍照片,或者为不能在现实生活中见到他们的Rep而感到沮丧,这些都不是什么稀奇的事情。今年早些时候,该应用移除了“色情角色扮演”功能,用户们对此感到如此伤心,以至于subreddit的版主们专门开设了一个自杀热线。

2. 基于角色的平台

如果你不仅仅想与一个AI机器人交谈,而是希望与多个机器人交谈,那么像Character AI这样的平台就可以满足你的需求。在这个平台上,你可以与数百个AI驱动的角色进行信息交流,从名人到流行的动漫角色都有。你还可以创建自己的角色,赋予他们描述、图像、个性,甚至更高级的特性。用户会创建详细的属性列表,并通过评价他们的回应并生成新的回应来花费数小时来训练他们的角色。

近年来,专门用于与机器人聊天的应用程序和网站呈现出爆炸性的增长,它们的SFW(Safe for work也就是内容尺度)程度各不相同。其中包括:Chai,Janitor AI,Chub AI,Charstar和SpicyChat等。

a16z最新预判|AI虚拟陪伴生态全解析

3. DIY开发者工具

这个选项更为技术化,但是它可以让你在形态和AI伴侣的性格上有最多的控制权。你可以拼凑一些工具来创建你理想的伴侣,你可以与他们发送信息、打电话,甚至实时视频聊天:

性格(用于文本的大型语言模型):有许多开源模型(尤其是Vicuna和Pygmalion)经过微调,特别适合从具有特定性格到无审查角色扮演等各种用例。

记忆(向量存储):像Pinecone这样的向量存储工具让你能与你的虚拟人建立持续的关系,通过配置代码存储长期记忆、背景故事和其他独特的信息。

语音(用于语音的语音合成):像ElevenLabs这样的产品可以为你的虚拟人提供声音,让你可以控制年龄、性别和口音。

外貌(用于图像的稳定扩散模型):像Civitai上的LoRAs可以让你对AI虚拟人图像的风格、细节和设置有细致的控制。

动作(用于视频的动画):像D-ID和HeyGen这样的工具可以使图像“说话”;虽然我们已经看到一些生成高保真度说话脸部的有前景的新模型,但可接触到的并不多。

平台:这是陪伴的底层代码和内部逻辑得到执行的地方。如今,大多数开发者仍在GCP和AWS上部署和运行他们的AI陪伴,但像Steamship(GirlfriendGPT在这里运行)这样的解决方案正在迅速获得针对特定陪伴用例的关注。

UI层:一个让你实际与你的陪伴互动的前端。SillyTavern、Agnaistic和KoboldAI是流行的选项。

a16z最新预判|AI虚拟陪伴生态全解析

如果你想尝试,我们刚刚发布了一个用于开始构建AI应用程序的开源模板(Github地址:https://github.com/a16z-infra/ai-getting-started)。该项目包括了你从零开始编写陪伴所需的所有基础部分:处理基于文本的模型,流式聊天回应,为虚拟陪伴生成正确的外观,以及在向量数据库中存储长期记忆。我们还将发布后续文章和更多的开源项目,详细介绍开发人员用来创建AI伴侣的技术栈。

三、未来会怎样

AI陪伴才刚刚起步,跟再过两三年后的关系深度和复杂性相比,我们今天拥有的工具将会显得像玩具一样,但我们依旧可以从中看到一些可能的下一步迹象。

1. 真人型AI陪伴

在五月,网红Caryn Marjorie推出了她的“AI女友”,该女友使用了她的声音,并接受了她数千小时YouTube视频的训练。用户付费1美元每分钟与她在私人Telegram频道上进行交谈——他们发送语音备忘录,她则以自己的方式回应。

像Forever Voices这样的公司已经在为其他网红创建类似的角色,在不久的将来,拥有一个AI陪伴对于任何通过订阅(例如Patreon,OnlyFans)或打赏来盈利的创作者或名人来说,都将是一种自然的延伸,消费者已经愿意通过付费来体验更接近这些名人的感觉。

最终,每个人都拥有一个可以与他们的朋友和家人——甚至是更广泛的观众交流的AI角色是有意义的。然而,需要解锁这一场景的几个关键点包括版权许可,正确的训练数据集(并非每个人都有可以使用的YouTube视频),以及除了付费的Telegram机器人之外的适当的“形式”。

2. 支持多模态的AI陪伴

现在的大多数AI陪伴都存在于移动应用或网页客户端上,这自然限制了用户与它们交流的方式。到目前为止,我们见到的主要是文本和一些语音交流(即使是这样,大部分也是异步的,而不是实时的)。这限制了关系的真实性和沉浸感,以及AI陪伴能与用户一起体验的内容。

我们预期将会看到这种情况扩展到与虚拟人进行实时电话和视频通话,以及虚拟人在各种媒介上主动发起更多的对话。如果Apple Vision Pro能够打开头戴式产品的消费者市场,那么AI虚拟人能够全天陪伴用户,作为一个始终可用的朋友或陪伴,并不是不可能的事情。(《银翼杀手2049》的粉丝可能会认出这个概念!)这将显著改变用户与他们的虚拟人共度的时间以及他们形成的关系深度。

最终,我们甚至可以看到一个世界,其中某人的AI虚拟人可以与其他人交互——或者AI陪伴可以彼此交互(这是“在互联网上,没人知道你是一只猫”这个梗的延伸)!

3. AI陪伴类型会变得丰富

虽然情侣关系是一个自然的起点——对这种使用情况的需求很大,而且愿意支付的价格也很高——但我们认为,可以为各种类型的关系建立AI陪伴平台。

我们在生活中总会有需要朋友、导师,甚至只是一个愿意倾听的人的时候。比如,全国性的廉价心理咨询师短缺就是一个例子。虽然现在的AI虚拟人主要还没有能力处理心理健康问题,但你可以想象一个专为此目的设计的虚拟人,它经过数百万小时的临床会话训练,可以紧密模仿人类的言行。实际上,早期的研究已经表明,AI在诊断准确性和服务方面都能胜过真人医生。

另一个潜在的使用场景?娱乐!就像我们之前提到的,Snapchat的MyAI聊天机器人在前两个月就收到了来自1.5亿用户的100亿条信息。由于用户年龄的问题,Snapchat的MyAI明确禁止形成情侣关系或讨论可能的NSFW(尺度较大)话题。MyAI的使用主要是轻松的,专注于娱乐。(你可能至少看过一个MyAI的梗。)到目前为止,大部分的公开使用案例都围绕着尝试欺骗应用说出疯狂的话,或者只是为了好玩,让它走进几乎不可思议的角色扮演场景

a16z最新预判|AI虚拟陪伴生态全解析

4. 将AI融入人类互动中

与机器人聊天很有趣,但把机器人添加到你的群聊中可能会更有意思。虚拟陪伴的未来不仅仅是一对一的交互,还包括将AI角色纳入你现有的关系和社区。想象一下,一个AI婚恋指导员加入你和其他人的聊天,调解分歧,建议活动,或给予建议。

已经有一位开发人员创建了一个Slack工作空间,他和他的朋友与一群具有不同性格、兴趣和技能的机器人一起玩耍。在开玩笑和分享他们个人生活的故事之间,机器人回答编程问题,对产品想法进行即兴创作。不难想象,在我们所有的虚拟对话中,无论是个人的还是专业的,AI陪伴都将在其中发挥作用。

四、总结

生成型AI模型将从根本上改变我们与计算机的关系,让它们成为我们的同事、朋友、家庭成员,甚至恋人。到目前为止,关于大型语言模型(LLM)的大部分关注都集中在它们如何自动化更传统的任务——比如客户支持、研究、文件起草和总结——但当你看到什么在驱动新兴的消费者用例和激动人心的事物时,AI陪伴引领着前行。

这只是人机交互巨大转变的开始,这将需要我们重新审视与某人(无论是人还是机器人)建立关系的含义。我们正在进入一个比我们能想象的要怪异、狂野、美妙得多的新世界。这篇文章提供了我们看到的早期活动的一角,但我们有信心,在互联网的遥远角落,还有更多的事情正在发生——我们迫不及待地想看到AI陪伴在我们中间占据它们应有的位置。

参考材料:

[1]https://a16z.com/2023/06/22/its-not-a-computer-its-a-companion/

专栏作家

深思圈,公众号:深思圈,人人都是产品经理专栏作家。《十五个酷应用玩转树莓派》作者,连续创业者。做过教育、工具和SaaS等行业,关注出海、SaaS和AIGC领域,擅长产品、营销和增长。

本文翻译发布于人人都是产品经理,未经作者许可,禁止转载。

题图来自 Unsplash,基于 CC0 协议。

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!