OpenAI 340万美金投资,Apple前设计师联合创建的私人助手,将记忆连点成线、成诗

0 评论 2436 浏览 0 收藏 17 分钟

未来 AI 驱动的人机交互与行为模式会是什么样的?或许我们可以从一款智能记忆 APP「Dot」中看到一些痕迹。在这篇文章里,作者就对「Dot」这款 AI-Native 产品做了分析拆解,一起来看看。

乔布斯 2015 年在斯坦福大学演讲时说过一个非常有名的「连点成线」的故事,过往的各种经历都会在未来的某一天连点成线。计算机和软件的出现,帮助人类扩充了脑中知识的容量,但并没有从根本提高人类对信息的处理能力,人类仍然反反复复地重复学习和遗忘的过程,更擅长处理和记忆关联度高、相似的知识,而不善于不同时刻记忆之间的联想和发散。

然而,连点成线的背后是大脑神经元对过往信息的存储,LLMs 展现出的通用语义理解和推理能力使得其天然能够帮助人们实现大脑记忆。由OpenAI Fund 340 万美金投资的一家旧金山的公司 New Computer 刚刚发布一款智能记忆 APP「Dot」,用极其优美简洁的方式让我们看到了未来 AI 驱动的人机交互与行为模式。

将记忆连点成线,甚至卡片组合成诗,笔者昨天看到这款产品后连夜写了这篇文章,应该算是 SenseAI 最近看过最惊艳的 AI-Native 产品了,像诗一样的。曾经离家上学前外婆手写的烧饼菜谱,或许会在多年后的周五下班回到家弹出,“想念家乡的味道了吧,做一个外婆的烧饼吃吧”。

思考:

我们尝试基于文章内容,提出更多发散性的推演和深思,欢迎交流。

从生产力工具到个人伙伴(her):早期 Gen-AI 产品最容易想到的是工具,写文字、代码或者画图,而 LLM 具备的通用语义理解和推理能力使得其天然更适合了解“你”。从用工具解决点状问题,到纵向深入理解用户,帮助用户专注于真正重要的事情,做人类的延伸,而非取代人类

不仅仅是人与信息的关系:Dot 展示了 AI 如何重塑人和信息关系的可能性,而非单纯做一个更好的笔记工具。这种思考方式或许也能迁移到别的领域,如对社交关系的重塑,人和人之间总是先认识,再了解、交换信息,最后判断契合。然而当 AI “比你先认识你自己”,主动意图识别需要的信息,先分发、再认识。AI 可能会重塑未来的双边关系。

AI Native 产品分析——Dot

1. 产品:Dot,一个智能指南/个人助手,帮助用户记忆、管理并且主动引导用户的生活

2. 产品上线时间:测试中,年底在 iOS 和 Web 端上线

3. 创始人:

Sam Whitmore:New Computer 的 CEO / CTO,同时是 LangChain 的早期核心贡献者之一。在此之前是 Kensho 的前工程负责人,Kensho 于 2018 年被 S&P Global 以 $5.5 亿美元的价格收购。随后担任 Maximus 的工程主管,该公司是一家与 IMAX 合作开发视频超分辨率软件的初创公司。

Jason Yuan:前 Apple 设计团队成员,MakeSpace(现称为 Sprout)的创始人,mercuros.com 的创建者并开拓了生成式界面的想法。与 Blackpink、Chanel、Vogue、Jackson Wang、The MET Gala、Nike、Christina Aguilera、FKA Twigs 和 The Weeknd 等文化创造者合作过项目。

一、Dot 是什么?

Dot 来自旧金山的创业公司 New Computer 打造的智能指南(Intelligent Guide),由联合创始人 Jason Yuan(Apple 设计团队前成员)设计,并由 Sam Whitmore(S&P Globoal 人工智能创新部门 Kensho 的前工程主管)和一个小的开发团队完成,帮助用户记忆、管理并且引导用户的生活。

Dot 的理念也许来自己 2005 年乔布斯在斯坦福演讲时说过的一句话,「You can’t connect the dots looking forward; you can only connect them looking backwards. So you have to trust that the dots will somehow connect in your future.」

而 Dot 则说,「Making sure my Dots stay connected. Looking forward is easier that way. When you help me see what’s come to pass,it sheds light on what’s yet to come.」

简单解释,Dot 是一个 Chatbot 形式的信息导航产品(Information Navigator),像用户的外置大脑,帮助用户连点成线「向前看」,成为更好的自己。

Dot 致力于成为用户的长期伴侣,而非更好的任务管理(Task Management)工具,联合创始人 Yuan 说 「Dot 的感觉是,当你不知道该去哪里、该做什么或该说什么时,你就会求助于 Dot」。

那么用户具体如何使用 Dot?Dot 给出了几个具体的场景。

场景 1:

Mei 是一个大学新生,今天是她离开家的最后一天,外婆交给了 Mei 一份手写的食谱,记录了她最爱吃烧饼的做法,于是 Mei 可以将这份食谱分享给了 Dot,Dot 会自动将图片中的内容转化为结构化的电子食谱,并和其他食谱笔记归类到一起

场景 2:

Mei 提前一天将课程大纲的文件发给了 Dot。当 Mei 来到书店时,向 Dot 提问自己需要买哪些教材。Dot 会自动将任务关联之前的课程大纲,为 Mei 提供一份可交互的待买清单。

场景 3:

Mei 已经习惯了将生活和学习中的种种都保存至 Dot,于是当考试来临时,Dot 可以根据考试科目和过往上传过的所有相关学习资料,为 Mei 出题测验,并在测验过程中随时回答 Mei 的问题。

场景 4:

在用 Dot 辅助学习的过程中,Mei 对于某个概念不太理解,Dot 可以根据 Mei 的习惯,使用用户更适应的风格,来解释这个概念。

场景 5:

在某一次的对话中,Mei 曾经和 Dot 提及想要更好地融入学校的社区,于是 Dot 根据用户的兴趣爱好,主动推荐了一些和用户兴趣相关的选项来帮助用户

场景 6:

Mei 在今天有一场重要的试镜,Dot 已经为用户安排好了所有日程,并且关联了所有日程的待办事项,这样她只需要全心全意专注于要做的事情。

场景 7:

最后,连点成线。Mei 通过了试镜,并且要参加社团的欢迎会。Dot 考虑到 Mei 曾经想要融入社区的意愿,推荐 Mei 根据奶奶的配方,做一些家乡食物带去,来更好地融入集体。

二、Dot 的 7 大核心能力

在上述的几个场景中,展示了 Dot 的几个核心基本能力:自动文件管理(Automated File Management)、自适应智能(Adaptive Intelligence)、上下文多模态理解(Contextual Multimodal Understanding)、自我编程(Self-Programming)、个性化显示和检索(Personalized Display and Retrieval)、概念复合(Conceptual Synthesis)和心智理论(Theory of Mind)。

1. 自动文件管理:动态文件系统(Dynamic File System)

与大多数现有的 Chatbot 不同的是,Dot 具有长期的记忆能力,几乎会记住用户说的一切,无论用户和 Dot 的对话是否发生在同一个会话(Session)中。同时,Dot 支持用户用多种不同的方式来添加内容,如图片、PDF、语音、链接甚至是多种类型的混合。

同时,Dot 会通过一个称之为动态文件系统(Dynamic File System)的功能,自动创建、组织和检索结构化和非结构化的信息。动态系统中的一切,从分类到信息展示的格式,都是基于用户的使用习惯个性化的。

举例来说,当用户和 Dot 分享了足够多的笑话之后,Dot 就会自动创建一个针对笑话动态文件类型,来追踪用户所有的笑话、笑点和主题。

2. 上下文多模态理解:语境意识(Context Awareness)

Dot 具有极强的上下文处理能力,可以根据语境,从大量的记忆样本中,找到最重要的相关信息,并对相关的任务进行优先级排序,甚至结合用户的位置和日程,来为用户的日程安排给出建议,比如,用户可以向 Dot 提问今天最适合去快递点退货的时间是什么时候。

3. 个性化显示和检索:动态 UI(Dynamic UI)

Dot 可以根据材料和用户当下的需求,自动选择最合适的信息呈现方式,如引导用户进行小测验,创建交互式任务列表,甚至将用户发送的照片拼贴成精美的拼贴画。

4. 自适应智能:个性化(Personalization)

随着用户使用 Dot 的时间变长,Dot 会学习用户偏好的模式,并适应这些模式来和用户交流。举例来说,如果用户是一个偏好视觉的学习者,在过去和 Dot 的沟通中使用了大量图片,Dot 就会在表达时使用更多图片辅助;或者,Dot 可以察觉用户对某个特殊的隐喻或概念有共鸣,则会在后面的对话中更频繁地使用这些概念,来帮助用户建立这些概念和新的主题之间的联系。

5. 心智理论:主动作为(Proactive Agency)

Dot 持续判断用户的需求,并自发地行动。举例来说,如果 Dot 知道用户正在尝试素食主义,它可能会自发地研究同样营养价值的食物,为用户找到附近的素食餐厅,甚至推荐一些专注于素食烹饪的 YouTube 频道。除此以外,Dot 还会根据用户的兴趣定期问一些问题,帮助用户从新的角度理解旧的话题,甚至引导用户尝试原本不会想到的解决方案。

6. 自编程:自动化工作(Automations & Routines)

用户可以要求 Dot 在特定的时间执行特定的任务,因为 Dot 可以自动编写和存储一些例行任务程序。通过让 Dot 来记录和处理日常,用户可以更专注于重要的事情上。举例来说,用户可以设置 Dot 在每天早上生成一天的日程安排,在每周末对前一周发生的事情生成总结和反思等,也可以让 Dot 提醒用户每 3 个月更换一次电动牙刷刷头,以及每次亲朋好友生日时提前准备好祝福。

7. 概念复合:连点成线(Connecting the Dots)

Dot 可以将对用户重要的事情联系起来,即使是用户很久没有提起的事情。通过找到不同记忆之间的关联,并自然而然地展示这些内容,Dot 帮助用户用一种全新的视角看待生活。

三、Dot 有何不同?

比起其他 LLM 产品专注于通用的智能能力,来试图代替人类能做的工作,如创作文学作品或者写代码,Dot 则更专注于更纵向的方向,即如何深入理解用户,并帮助用户专注于真正重要的事情,做人类的延伸,而非取代人类。

计算机和软件的出现,帮助人类扩充了脑中知识的容量,但并没有从根本提高人类对信息的处理能力,人类仍然反反复复地重复学习和遗忘的过程,更擅长处理和记忆关联度高、相似的知识,而不善于不同时刻记忆之间的联想和发散。

而随着大模型逐渐展示类似人类的推理能力,Dot 试图成为用户知识的管理者来改变人类和知识的关系。通过帮助用户做信息的存储、检索、展示和关联,做用户活的历史(A living history),并通过高效利用用户每天摄入的信息,来提高用户的思考能力,而非单纯帮助用户读得更多,读得更快。

参考材料:

https://www.fastcompany.com/90975882/meet-dot-an-ai-companion-designed-by-an-apple-alum-here-to-help-you-live-your-best-life

https://new.computer/

编译:Shiqi;编辑:Vela

来源公众号:深思SenseAI;关注全球 AI 前沿,走进科技创业公司,提供产业多维深思。

本文由人人都是产品经理合作媒体 @深思SenseAI 授权发布,未经许可,禁止转载。

题图来自 Unsplash,基于CC0协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!