生产力工具大比拼!能打的海螺AI也该出来好好亮相了!
现在市面上的大模型产品有很多,那么,这些产品的表现如何?这篇文章里,作者就基于重度使用的基础上,对海螺AI这款多模态产品做了能力拆解和横向评测,一起来看看它的表现如何吧。
最近由于某个智能助手产品经常性的提示“太忙了”,对于我这样重度依赖AI的用户就很恼火!于是寻找其他的替代品,别说,真的让我找到一个很好用的智能伙伴,支持200k超长上下文+万亿参数MOE大模型的产品:海螺AI。
重度使用后,发现真香啊,于是很感兴趣,仔细的研究了一番,这篇文章,我们从几个要点来详细剖析下这款实力大于名气的智能伙伴。
- 产品介绍
- 能力剖析
- 双轮驱动
- 未来期望
Take Away:
- 长文总结、AI搜索、语音对话、知识库等方面提供全面的智能伙伴解决方案
- MiniMax公司的双轮驱动策略
- 用户体验优化和用户价值传递的重要性
一、产品介绍
智能搜索,文件速读,语音通话,文案神器,拍照答疑 嗨!我是小海螺,你的AI智能伙伴,帮助你学习工作效率加倍!
以上是海螺AI在应用市场里的介绍,可以看出,这是一个多模态产品,能在这几个场景提供AI能力:
- AI搜索
- 长文章/文件的摘要总结阅读
- 实时的语音交流
- 多种文案的撰写
- 图片识别/分析
打开App,首页比较清爽,重点突出了几大能力,同时也有很多Bot在发现页面里提供快速使用:
海螺AI首页相当简洁,用户能够很快的找到所需功能,把各类Bot做了收起,大幅降低了用户决策成本。
这和其他同类App存在显著差异,从生产力工具的定位来说,首页界面海螺更加明晰:
(豆包、文心一言、智谱清言、Kimi)
这几家对于第一次打开的用户并不是很友好,没有明确的帮助用户确定使用心智。真心建议其他几家学习一下。
使用后,我发现海螺AI的若干个能力超出预期,下面我们逐个来展开聊聊:
二、能力剖析
第一,长文总结
我们先拿海螺AI和Kimi号称最强的长文本总结做一个对比,这也是我常用的一个AI能力。
首先,使用一样的Prompt,这是我多次调整后的基于Kimi整理的文章总结Prompt,理论上Kimi会更加适应:
我希望你总结与阅读的内容是:https://mp.weixin.qq.com/s/R9-3Drlt1foX3M7Wx-JOYQ
请按照下面的逻辑去分析:
你是一个公众号文章阅读助手,用于帮助我总结文章并进行必要的思考,当我给你发送一段内容或一个链接时,你总是:
- 用200字简要阐述文章内容
- 提炼文章多个重要的观点;同时对于每个观点,你需要理解作者是用哪些事实与逻辑推演形成这些观点的,进行简要总结。
- 提炼文章最关键的数据(如有)
- 描述清楚文章的推理逻辑链条,并对每一步做批判性分析,看是否存在漏洞。
对应的链接文章是Super对于星野App的万字长文分析,所以我很理解里面的核心观点,看看两者的对比:
首先在格式上,右侧的Kimi有更清晰的缩进,但也导致了可阅读区域过窄,在App里阅读上有一定影响,因为我更希望能够快速扫描,获得最关键的文章洞察,用于帮助我筛选是否值得花时间仔细阅读长文,所以尽可能的在更少滑动的内容范围内能快速完成阅读。
其次在内容的提炼上,两者整体差不多,不过海螺AI抓住了一个非常重要的关键点:
作者认为,星野的商业收入不是北极星指标,而是通过用户量和数据来驱动大模型的优化和公司的发展。
这一点Kimi漏掉了,但又是极其重要的一个观点。
另外,这一段Prompt里面很重要的是,获得AI对原文的批判性分析,这有助于我快速理解文章是否可能会存在一些结论上的约束条件!再来个截图对比:
主观判断来看,海螺AI抓到了一个比较好的批判点:用户洞察是否足够充分?这会帮助我在阅读文章时,着重关注结论是否有足够的用户观察来获得。
而Kimi认为原文忽略了两种产品的用户体验差异其实是错误的,原文内有明确的对于两类产品带给用户体验的差异性表达:
这是海螺AI带给我的惊喜,因为Kimi一直以长文本自豪,但在万字长文的总结里,海螺AI不光没有落后,反而有超越!很让人惊喜!
第二,论文阅读
最近我也写了一篇产品经理是否需要刷论文的文章,尽管结论是不需要刷那么多,刷到人焦虑,但适当的进行一些阅读是有必要的,特别是一些有突破性潜力的论文。
我使用的阅读论文Prompt如下:
论文解析,我希望你总结与阅读的论文链接:https://arxiv.org/pdf/1706.03762
请按照下面的逻辑去分析:
你是一个AI资深的技术专家,擅长于解读论文,然后用通俗易懂的语言描述,用于帮助我论文阅读并进行必要的思考,当我给你发送一段内容或一个链接时,你按照下面的步骤逐步执行:
第一步,用200字描述这篇论文的核心亮点
第二步,描述这篇论文在解决什么问题?
第三步,为解决这个问题,还有哪些相关研究?
第四步,论文如何解决这个问题?(实施步骤、操作细节等)
第五步,论文做了哪些实验?(尤其是消融实验)
第六步,论文的主要结论。(尤其是具有建设性、非共识观点)
第七步,有哪些问题值得进一步探索?
对应的论文链接是Transformer,那我们继续来做个对比:
再看看结尾部分:
我们会发现海螺AI和Kimi在总结方面基本相同,都是模型的可解释性、长序列处理能力、资源消耗等,只不过描述的角度略有不同。打个平手。
文心一言很莫名奇妙的总结了其他论文,害得我又重新回去检查了一遍,确实是完全一样的论文地址,并且要求核心亮点200字,也只输出了不到100字,太偷懒了。
智谱清言在这个case中未能打开对应的论文页面,尝试了两次都是如此。
第三,AI搜索
AI搜索是一个Super认为非常有前途的细分应用,对于用户来说,很有可能使用后就不愿意再用传统的搜索引擎了,在这个方向上,海螺AI和Kimi都做了一些优化。
我们直接看效果:
比如我查特斯拉最新的财报,海螺给出了最新的2024年Q1财报,kimi给的是2023年的财报,同时我点开了kimi参考的资料,居然没有找到一篇最新的财报数据。。。
下一个case:“查一下上海稀宇公司的高管团队”,这个case稍微有点意思,因为这是MiniMax的公司名称,全称是:“上海稀宇科技有限公司”,kimi给出的答案几乎是不可用的,同时我发现尽管搜索源里面包括了企查查、爱企查等链接,手动打开后是可以查到具体高管的信息,不知为何Kimi并没有在结果上呈现:
我们换一个,月之暗面:
这一个case里,月之暗面的介绍更加清晰一些,海螺AI简洁清晰,信息也给的很全面。
好,我们再来个第三方公司来看看,智谱:
对比下来,我们会发现,Kimi尝试提供更丰满的内容,但问题也很大:结构化要弱,搜集的信息全面性要少,会漏信息。
海螺AI更全面,结构也很清晰,附带了对应的引用来源,方便用户追溯,除此之外,也会在答案后面保留三个追问,如果感兴趣可以继续获得更多信息,对比下来还是海螺AI更好。
对于AI搜索,个人认为有三点非常重要的:快、准、全。
首先是不能搜索了很久还没给出答案,那用户都跑了,这一点两家速度都还不错。
其次是准确性,或者给出错误的信息,这会损害用户价值,在这一点上,我发现Kimi有些Case里会丢信息,在对于200k长下文为宣传特色的大模型来说,实属不该。
最后是全面性,信息整合应该是全面没有遗漏的,包括可以通过追问来进一步帮助用户补全信息,海螺AI显示的三个追问问题做的不错。
第四,极强的语音对话
ChatBot类产品,很少有实时通话功能,其实我们细想一下,人们从出生下来,最习惯和最直接的沟通方式就是语音对话,在语音对话场景下,信息的交互非常的高效,特别是AI音色拟人度高的情况下,甚至会让用户爱上使用AI产品。
众所周知,MiniMax的语音是国内最强,众多情感陪伴类产品都是接入它家的语音大模型,我有朋友之前做的产品接入语音后用户的付费意愿和使用量顿时就上了一个台阶,很强。海螺AI直接把这个功能开放出来,还是挺出乎我意料的!
对,海螺AI在主界面上就有通话键,点击后直接进入实时语音对话界面,同时可以选择32种不同的声音(惊呆了,这么多选择!):
从产品设计上就能看出和竞品的对比,大家可以听一下声音对比,我的开场白都是“晚上好啊,今天晚上我很开心跟你聊天。”:
海螺AI的音色很稳定,柔和,豆包两段语音中间过渡的比较突兀。
另外海螺AI在对话界面还支持倍速调整,还支持更换音色,这是豆包无法支持的能力。
实际体验下来,包括音色、语气、停顿、情绪,很多方面海螺AI接入的语音效果是更加的逼真,这就带来了更强的沉浸感和体验感。
更绝的是,还能克隆自己的声音,整个过程也就1分钟,但是能实现70%的还原度,效果不错:
克隆的声音除了自己用,还可以分享给家人。
咦,那岂不是可以通过创建智能体+声音克隆,很低成本的实现亲人的“复活”了么?
前段时间还有文章去写AI复活产业链的文章,标题类似:《AI“复活”逝者成流水线生意,收费从百元到万元》,所以,海螺AI免费就可以实现了。。。
第五,拍照识图
拍照识图有两个场景比较确切。
第一个场景是朋友圈图片配文案,海螺AI默认就有引导用户使用这一能力,我尝试了一下,可用:
第二个场景是表格类解析,我上传了一个自己的公众号阅读量表格,发给了5个生产力工具产品,进行数据提取,效果对比如下:
(从左到右,海螺AI、Kimi、文心一言、智谱清言、通义千问)
Kimi提示不支持JPG格式上传,文心一言说看不懂,智谱清言整体是对的,但最后一行出现了幻觉,通义千问完成了任务,但使用了Markdown格式,阅读起来很不方便。这个case里还是海螺AI最符合我的需求。
第六,知识库
知识库是一个很有潜力的场景,有几类用户会有很强的需求:
- 企业知识管理类
- 研究人员&老师&学生
- 专业人士(医生&律师&咨询顾问)
- 内容创作者
- 知识工作者
对于海量信息,知识库结合AI,就可以做到快速检索,信息组织等等工作。
比如Super自己一直想有一个独属于自己的知识库,把一本书上传上去,然后可以不断地通过和AI交流来更好的理解。
经过测试,目前海螺AI、Kimi、智谱清言支持,其中海螺AI和智谱清言可以创建独立的智能体,Kimi只能单独上传文件,然后通过历史对话找回,或者重新上传。
我把一本自己读了4遍的书籍《10x is easier than 2x》中文精修版上传给了三家,然后提两个问题,看看对比效果:
第一个问题:书中need和want的区别是什么?
(从左到右:海螺AI、智谱清言、Kimi)
海螺AI会详细地先解释Need和Want各自的一些含义,最后再做一个区别总结。智谱清言会做很简单的总结。Kimi选择了多个维度来进行对比。
第二个问题:10x的思路对于哪一类人更有效?
海螺AI直接给出了具体的人群画像,并且解释为何适合;
智谱清言从原因出发,也是一种合理的解释方式;
Kimi。。。又开始忙了-,-
小结
这一章节,Super从长文总结、AI搜索、语音对话、拍照识图、知识库几个自己常用的方面,和其他一些竞品做了少样本量的横向对比,可以发现,海螺AI不仅仅是一个简单的工具,它通过精准的长文总结、深入的论文解析、高效的AI搜索、自然的语音对话、准确的拍照识图以及强大的知识库管理,为用户提供了一个全面的智能伙伴解决方案:
- 研究人员:快速总结和分析长篇学术论文或研究报告;
- 老师&学生:知识库管理功能可以协助他们组织和检索课程材料,提高学习和教学效率;
- 内容创作者:AI搜索快速整合关键信息,并生成爆款文章;
- 日常用户:AI搜索和语音对话功能可以提供生活中的即时帮助;
- 知识工作者:知识库管理功能可以帮助整理和回顾学习资料
简单来说:海螺AI很像一个六边形战士,每一边和竞品对比,都很能打!
为何这么强呢?我又去研究了一下产品背后的公司和团队:MiniMax、闫俊杰。
三、大模型技术和C端应用双轮驱动的MiniMax
4月17日,晚点LatePost发了一篇文章,标题是:《对话 MiniMax 闫俊杰:AGI 不是大杀器,是普通人每天用的产品》
有几个亮点:
- MiniMax公司估值25亿美元,是国内大模型第一梯队的独角兽;
- ChatGPT还没发布,闫俊杰最早提出AGI,领先所有其他大模型独角兽公司;
- 是AI独角兽中目前对2c产品投入最早最大的公司,有多个突破100万日活的应用;
- 国内最早推出MoE大模型,并且是万亿参数。
Super过去写过多篇情感陪伴类的产品分析文章,其中星野是国内众多产品模仿的对象,这款App就是MiniMax家的产品,我们看一下这篇文章里值得理解的几个要点:
《晚点》:MiniMax 是国内第一个说 AI 2C 的公司,为什么?
闫俊杰:…我一直不认为 AGI 会像一个原子弹、一个大杀器,它就是普通人每天会用的一个产品、一个服务——这也是我们最坚持的。
而且 AGI 也不应该是一家公司自己做出来,它要靠这家公司和它的用户一起做出来。
《晚点》:那你们为什么不干脆只专注做产品?现在有很多开源大模型。
闫俊杰:核心原因在于,对模型的理解基本上等同于对产品的理解。产品越往下做,对模型理解肯定要越深。
另一个客观原因是成本和响应时间,如果没有对模型的强掌控力,就很难掌握产品成本的变化,也无法调教对用户的响应时间。而且做产品你会遇到很多问题,什么问题可以解决?什么不能解决?怎么迭代?这些都需要你对技术的掌握。
《晚点》:技术重要,产品也重要,你们纠结过到底哪个更重要吗?
闫俊杰:…现阶段产品价值的来源,核心还是你的模型性能和算法能力。
这样的事我们经历了好几次,你可以做很多产品 feature,但你会发现,几乎所有大的提升都来自模型本身的进步。
从以上三个点来看,我们会发现闫俊杰和MiniMax对于大模型能力的坚持追求,在技术突进式进化的过程中,特别是“模型即产品”的产品类型里,产品的飞跃靠的还是底层的大模型能力。
另外一个层面,用户在“模型即产品”里会共创出很多的user case,帮助公司找到更实用的场景,用数据飞轮驱动模型在场景上面能力的提高,从而迈向AGI:
跑出了情感陪伴类产品目前的天花板:
《晚点》:MiniMax 产品的日活已接近 Character.AI(美国 AI 独角兽开发的一个可以和各种 AI 角色聊天、互动的应用),使用时长甚至更长。
海螺AI也是MiniMax的排头兵,通过接入MiniMax最新的万亿参数MoE大模型abab6.5系列,支持200k tokens的上下文长度,来直接响应用户的需求。
通过上一节的对比分析,我们能看出海螺AI很能打,后面更多等着用户不断地创造新的场景和数据,来指引MiniMax在大模型能力层面的迭代。
四、未来期望
沿着双轮驱动的思路,我们也会发现,海螺AI是一个六边形战士,但super认为,这里有几个产品策略是海螺AI可以进一步优化的::
第一,用户体验的优化
首先是作为AI智能伙伴,有没有可能更深入的基于我的偏好,在整体AI输出层面来提供更好的服务呢?
1)个性化文本风格
海螺AI可以提供定制化的文本风格选项,允许用户根据自己的喜好选择不同的表达方式。例如,用户可以选择更喜欢逻辑性强、条理清晰的风格,或者偏好直白、通俗易懂的语言。
2)智能预设Prompt
设计一套智能预设系统,根据用户的过往互动和选择,自动生成或调整Prompt,以更好地满足用户在长文本摘要、论文关注点等方面的需求。
当前海螺AI在移动端整体的体验偏简洁,这些能力可以很快地加上来增加用户的体验。
第二,用户价值的传递
作为AI产品经理,我们深知技术术语如“万亿参数的MoE”对于专业人士的意义,但普通用户可能并不熟悉这些概念。因此,我们需要将技术优势转化为用户能够直观感受和理解的价值点。
首先,我们需要简化和明确产品介绍的语言。
例如,将“智能搜索”改为“即时答案,一问即得”,这样的表述更加直接和易于理解。对于“语音通话”,我们可以解释为“语音对话,如同真人”,这样用户就能快速把握其核心功能。
接下来,我们可以进一步细分用户群体,并针对不同群体,提炼出明确的价值点。例如:
- 对于学生和研究人员,强调海螺AI在学术资料搜索和论文阅读上的能力,可以表述为“学术伙伴,深入洞察,助力研究”。
- 对于职场人士,突出其在提高工作效率和文案创作上的优势,可以描述为“文案伙伴,创意无限,效率倍增”。
- 对于普通用户,可以强调其便捷性和易用性,比如“生活伙伴,一问即答,生活无忧”。
此外,我们还可以通过以下方式来加强用户价值的传递:
- 故事讲述:使用真实用户的故事来展示海螺AI如何在不同场景下帮助用户解决问题。例如,一个学生如何利用海螺AI快速完成论文资料的搜集和整理,或者一个职场人士如何通过海螺AI提高工作效率。
- 社区参与:建立用户社区,鼓励用户分享使用经验,形成口碑传播。比如创建一个官方论坛或社交媒体群组,作为用户交流和讨论海螺AI的官方平台。提供一个场所,让用户可以分享经验、提出建议或互相帮助。以及在创建自己的社交媒体,传播一些用户参与的User Case。
通过这些方法,海螺AI不仅能够更好地传递其用户价值,还能建立起一个活跃的、忠诚的用户社区,这对于品牌的长期发展至关重要。
包括,现在AI产品同质化很严重,怎样在这种竞争形式中尽可能大地做出差异化,打开更多市场需求和用户增长空间?
总结
这篇文章是Super在重度使用海螺AI后,沿着生产力工具/智能伙伴定位去对它做的能力拆解和横向评测。
整体使用下来,发现海螺AI依靠着极强的模型能力,结合不错的产品设计,在这个市场方向上绝对是Top级的水准。
我们也结合MiniMax这家公司对于AI的理解一并做了解析,会发现他们家确实是非常的低调和努力,成立两年多以来,创始人只接受了这么一次访谈,之前我请教闫俊杰,他也一直说在闭关,冲刺技术。
努力带来回报,包括我很熟的AI产品朋友,评估下来都认为abab6.5模型是国内最强的大模型之一,体现在海螺AI上,也就带来了最优秀的体验。
很期待海螺AI不断的进化,带给我们更多惊喜!
参考
对话 MiniMax 闫俊杰:AGI 不是大杀器,是普通人每天用的产品
专栏作家
Super黄,微信公众号:Super黄的念想,人人都是产品经理专栏作家。专注于深度产品拆解+商业分析。
本文原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于CC0协议。
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
- 目前还没评论,等你发挥!