AI产品观察:现在做播客都可以不用说话了?—NotebookLM
去年5月,Google推出了一款基于AI的笔记管理工具NotebookLM。作为一款有大模型支持的笔记应用,其具体表现如何?这篇文章,我们来看看作者的分析。
一句话概述:NotebookLM是谷歌推出的一款基于AI的笔记管理工具,旨在帮助用户高效地组织和提取信息,通过与用户上传的文档结合,生成实用的内容和见解。
一、基本信息
前身为谷歌的Project Tailwind产品,该项目由谷歌实验室的小团队开发,在2023年 5 月的 I/O 2023 上进行了产品先导,谷歌推出其 “AI-first notebook”,新名称为:NotebookLM,该产品由此应运而生。
Project Tailwind旧图标
Logo
NotebookLM的Logo采用简洁的图形+字母的设计,以黑白色彩为主,体现了其作为谷歌产品的身份,同时传达出现代和高效的感觉。
Slogan:
Do your best note-taking
平平无奇谈不上有什么特别大的内涵输出。
二、功能拆解
- 语音转播客:根据上传的文本进行语音转化,根据文本内容生成两人对话式的英语语音对话录音
- 文档上传与管理: 用户可以上传各种格式的文档(如Google drive文件、PDF等),并创建笔记本以组织信息。
- 信息摘要与提问: AI能够根据上传的文档自动生成摘要,并允许用户提出问题以获取更深入的信息,可以进行时间轴整理、目录整理、指南、简报等笔记创作。
- 实时协作: 支持多用户实时编辑同一笔记本,方便团队合作。
- 引用与来源管理: 根据上传的文件对提问的答案生成自动生成引用,确保用户可以追溯到原始信息来源。类似于内部文件的RAG
三、核心技术
NotebookLM基于谷歌最新的大型语言模型(LLM)Gemini 1.5 Pro,采用源基础模型(source-grounded model)技术,使得AI生成的信息更贴近用户提供的文档内容,从而减少错误和“幻觉”的发生。
四、盈利模式
NotebookLM体验版目前为免费服务
揣测其未来可能会探索以下盈利模式:
- 增值服务: 提供高级功能或云存储空间扩容,吸引用户升级到付费版本。
- 企业版: 针对企业用户推出定制化解决方案,收取订阅费用。
- 特定功能付费: 提供例如转音频以及未来可能迭代的高阶功能进行token计费制服务。
五、不足与迭代
- 当前上传文件的格式仅限于pdf、txt、Google drive文件、markdown格式。word、ppt、excel乃至epub(量子速读)格式都无法进行上传
- 源数量限制50个,如果针对企业级文档量级如此数量不足,可能限制复杂项目的处理能力。
- 转语音的功能目前只支持英文和官方音色,无法支持对话人数设置、音色自训练、多语言沟通或者穿插交流的定制
- 由于端到端的特性限制,在音频对话时的节奏感和幽默感效果不可控
六、战略方向
语音功能重点开发:
未来可以将语音功能单列成为特殊功能板块进行迭代,不仅限于当前的简单tts转化。开发训练独立音色、音频提取、音频剪辑等功能。
工作流功能:
针对会议语音处理、学习资料复习、报表研究等特定工作流场景可以进行工作流功能板块引导,提示用户使用PMF,保证产品直击痒点和痛点。
硬件融合:
除了谷歌自己的pixel手机以外,该产品可以成为安卓的原生功能,亦或者谷歌与其他安卓厂商合作,将功能内嵌至硬件设备系统中。
本文由 @笑笑生观察日记 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务
- 目前还没评论,等你发挥!