AI产品观察:现在做播客都可以不用说话了?—NotebookLM

0 评论 1378 浏览 1 收藏 6 分钟

去年5月,Google推出了一款基于AI的笔记管理工具NotebookLM。作为一款有大模型支持的笔记应用,其具体表现如何?这篇文章,我们来看看作者的分析。

一句话概述:NotebookLM是谷歌推出的一款基于AI的笔记管理工具,旨在帮助用户高效地组织和提取信息,通过与用户上传的文档结合,生成实用的内容和见解。

一、基本信息

前身为谷歌的Project Tailwind产品,该项目由谷歌实验室的小团队开发,在2023年 5 月的 I/O 2023 上进行了产品先导,谷歌推出其 “AI-first notebook”,新名称为:NotebookLM,该产品由此应运而生。

Project Tailwind旧图标

Logo

NotebookLM的Logo采用简洁的图形+字母的设计,以黑白色彩为主,体现了其作为谷歌产品的身份,同时传达出现代和高效的感觉。

Slogan

Do your best note-taking

平平无奇谈不上有什么特别大的内涵输出。

二、功能拆解

  • 语音转播客:根据上传的文本进行语音转化,根据文本内容生成两人对话式的英语语音对话录音
  • 文档上传与管理: 用户可以上传各种格式的文档(如Google drive文件、PDF等),并创建笔记本以组织信息。
  • 信息摘要与提问: AI能够根据上传的文档自动生成摘要,并允许用户提出问题以获取更深入的信息,可以进行时间轴整理、目录整理、指南、简报等笔记创作。
  • 实时协作: 支持多用户实时编辑同一笔记本,方便团队合作。
  • 引用与来源管理: 根据上传的文件对提问的答案生成自动生成引用,确保用户可以追溯到原始信息来源。类似于内部文件的RAG

三、核心技术

NotebookLM基于谷歌最新的大型语言模型(LLM)Gemini 1.5 Pro,采用源基础模型(source-grounded model)技术,使得AI生成的信息更贴近用户提供的文档内容,从而减少错误和“幻觉”的发生。

四、盈利模式

NotebookLM体验版目前为免费服务

揣测其未来可能会探索以下盈利模式:

  • 增值服务: 提供高级功能或云存储空间扩容,吸引用户升级到付费版本。
  • 企业版: 针对企业用户推出定制化解决方案,收取订阅费用。
  • 特定功能付费: 提供例如转音频以及未来可能迭代的高阶功能进行token计费制服务。

五、不足与迭代

  1. 当前上传文件的格式仅限于pdf、txt、Google drive文件、markdown格式。word、ppt、excel乃至epub(量子速读)格式都无法进行上传
  2. 源数量限制50个,如果针对企业级文档量级如此数量不足,可能限制复杂项目的处理能力。
  3. 转语音的功能目前只支持英文和官方音色,无法支持对话人数设置、音色自训练、多语言沟通或者穿插交流的定制
  4. 由于端到端的特性限制,在音频对话时的节奏感和幽默感效果不可控

六、战略方向

语音功能重点开发:

未来可以将语音功能单列成为特殊功能板块进行迭代,不仅限于当前的简单tts转化。开发训练独立音色、音频提取、音频剪辑等功能。

工作流功能:

针对会议语音处理、学习资料复习、报表研究等特定工作流场景可以进行工作流功能板块引导,提示用户使用PMF,保证产品直击痒点和痛点。

硬件融合:

除了谷歌自己的pixel手机以外,该产品可以成为安卓的原生功能,亦或者谷歌与其他安卓厂商合作,将功能内嵌至硬件设备系统中。

本文由 @笑笑生观察日记 原创发布于人人都是产品经理。未经作者许可,禁止转载

题图来自Unsplash,基于CC0协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!