AI如何支棱起来?
在人工智能的浪潮中,我们如何让AI真正成为我们的得力助手,而不仅仅是一个冰冷的工具?本文以一种轻松幽默的方式,探讨了AI在信息接收与输出、不确定性降低、交互效率提升等方面的最新进展和应用实践。
本来这篇文章想用《最近有关AI的感悟和总结》来做标题的,但写上的时候,就感觉没有意思,很无聊,也不够酷。那怎么样才能让这篇写AI感悟的文章变得有趣呢?
1、得用梗图,有了,各个领域的AI小助理来帮我,这可不就是专业团队嘛~
2、标题得通俗易懂,其实分享的感悟都是AI怎么样才能变得更好来帮助我们,也就是AI怎么样才能支棱起来?
ok,那这就是今天的文章,我们一块往下看!
1. 人会通过AI接收信息以及通过AI输出信息
之前是人类自己接收信息和输出信息,现在的一个发展趋势是人还在中间,但是我们会通过AI来接收总结的信息以及通过AI来更好、更快的输出。
怎么形容呢?就有点像是之前是单层肉汉堡,现在还是一片肉,但是在肉的周围加了两片蔬菜,变成多层蔬菜肉汉堡,就像下面这张图一样。
来个接收信息的案例吧:谷歌的NotebookLM可以把上传的PDF通过播客的形式对外输出,举个例子,这在之前是一本书在网上,人直接看大部头的书,现在AI在里面加了一道转换,把它转变为讨论书的播客,之前人们还从来没见过能把书自动转为播客的软件,那这个就很惊喜。
其实带着这个思路我们可以想象有哪些可以做的尝试,比如说把难啃的大部头教科书、无聊的研报或者项目白皮书,换成一种另外一种人们有兴趣的信息接收方式。
那什么形式更让人能接受呢?视频、音频、图文的信息相比于文字都更让人可以接受,如果再考虑到适用的场景,那可视化图文就是最好的方式了,因为它适用于几乎所有场景,又一目了然,napkin就在做这件事。
例如下面我想介绍napkin,然后把上面这段文字给复制进去让它理解,它就可以从里面找到我想对比的一个是大部头书本的无趣,另外一个是视觉内容的吸引力,总之,用napkin就是很搭。
输出信息的案例:这个就比较多了,比如说我最近在做的一个项目——AI报告,很多分析师需要写行业深度报告,这在之前可能需要分析师写上个好几天来从行业简介、竞争格局、行业政策这些方面输出,但是现在可能AI能够自动收集信息来帮你实现这一部分的输出总结,你可以在这个基础上加以人工的校验和修改就行了。
2. AI给出的答案是不确定的,但我们通过(prompt、流程、交互)可以把不确定性降低。
这个可以链接到我之前的文章:涉过真实的AI浪潮,在做AI会议助理这款产品的时候,就是通过类似于建房子的方式一步步达到客户想要的会议总结效果。
只不过对于大模型来说,提示词写的好是最简单也是最有效的步骤,也是建房子的第一步,先做好地基。
第二步,往往就是微调了,微调就是在这座房子打好地基,然后砌上砖瓦后,再铺上一层水泥,这时候就有大致的形状了。微调会让文本总结/生成这种更趋向于客户想要的标准,但还是存在一定的波动和不确定。
第三步,有些房子的形状我就是想这样或者是那样!比如我就想要中式建筑的屋顶,或者西式建筑的穹顶,这样才好看,才是我的style。ok,满足你,这里就是固定的流程,可能就是结合了简单的程序,比如固定取数和固定生成某段文字(例如财报会议中的数据整理)。
3. 单从效率来看,文字对话的反馈还是太慢了
就说一个体验上的问题,你吭哧吭哧打字半天,然后点击发送,再接着等AI的反馈,如果再碰到慢AI,一来一回都5秒有了吧,而语音交互这一块反馈就及时多了。
人类之间的对话也更倾向于语音对话,就像在工作中,我们遇到紧急问题还是会用电话甚至线下见面说。
很多AI情感陪伴类的app都有打语音视频这个功能,而且没准还是收费的。这也侧面验证了语音对话这个功能,相比聊天打字还是体验更好的,不然谁会付费啊。
近期一些大厂AI app在语音对话上也开始有动作了,例如豆包的语音对话,现在就可以联网搜索一些话题,阿里的通义现在可以在语音聊天的同时上传文件对话,而最早的场景英语口语助教更是每家必有。
那有没有一种更快的交互方式呢?有的,一种就是我们每天都在用的触摸和点击这种(其实互联网时代的触摸点击给出反馈是快于语音交互的);另外一种可能就是脑机交互了,等待马斯克这些大佬去突破了。
4. AI时代最有想象力的产品——画布
画布可以容纳和承载几乎所有内容形式:文字、表格、图片、音频甚至是视频,而AI又可以全部生成以上内容形式,所以理论上AI+画布的上限是无穷高的(max)。
钢铁侠和贾维斯对话也是在一个画布/面板上(咳…钢铁侠的头盔面板),上面可以实时反馈出任何信息。我还有一个臆想,我想让AI在画布上复刻一个二维地球,上面会无限平铺所有地球上的三维物体。对!那这个画布就是《三体》里面的二向箔。
百度文库也在近期宣布将上线“自由画布”这一款软件,但一直处于内测中,也没有人体验到。其实AI画布这种产品技术上实现可能难度为3颗星,但是算力消耗应该是最高的5颗星;多模态对于算力消耗巨大,估计目前也只有大厂能烧得起了。
5. AI也得揣摩人类甲方的意图
又懒又不想多打字的人类,你不多揣测一下它想问的是什么意思,怎么可能答的好?肯定会给你差评的!
这个我调研过chat类问答的用户数据,你会发现,能够问问题超过10个字的已经很牛了,因为有一半的人问问题都不超过10个字的,我称之为“打字要钱型用户”,当然我也是其中一员,10个字符以内一般能问啥问题呢?我举个例子:
- 你今天吃了没?(7个字)
- 总结这个报告(6个字)
- 写一份小红书营销文案(10个字)
这3个例子,大家就应该明白,我们大部分人让AI办事都是妥妥的大甲方。AI需要根据这些仅有的只言片语,来完成你给它布置的模棱两可的任务,如果AI不能满足你的期待,你就会像上面一样给它来个差评——点踩。
所以,AI还是需要会一点读心术的,通过简简单单的几个字就能读懂你我的心,知道我们想干嘛,这才是支棱起来(终于扣题了)的AI,也是我们最喜欢的乙方和员工。
写这一点也是因为在市面上我已经看到有比较好的产品案例了,蚂蚁的支小助就是这样一个能懂你心的AI助理。
因为工作原因,我可能用的投研支小助会比较多(还有其他类型,例如保险、营销、理财的),比如我问它:A股最近怎么样?(8个字)
其实这问题要是别人问我,我肯定会回答:什么怎么样?你说大盘走势吗,上周的,还是最近一个月的?很模糊的问题,我都搞不懂你想问的啥?
支小助这个会懂你心的AI助手,就会把“A股最近怎么样?”这个问题再“揣摩”一下,解读出6个相关的问题,如果你觉得它揣摩的不对,你还可以帮它改,相当于跟员工说:不是你想的这样,你得先这样,然后再那样…
之后再根据“揣摩”出来的6个解读,集中回答你的问题,所以就会比较全面,因为这6个解读总有一款适合你。
当然,一个硬币有正反两面——回答也就比较长,不够简短,你问它“1+1等于几”,支小助可能会给你扯出“1+1的哲学意义、1+1=2的数学原理”,所以也就有了快速解读这样一个功能。
按照支小助官方的解释就是,支小助内部嵌有很多的专家框架。它会根据你提问的问题去匹配对应的框架,例如刚才问的A股的问题,就会匹配股票分析、市场分析下面很多对应的框架。
这些框架你可以把它们理解为一个个专业的老师,当你带着同样一个问题比如:我该怎样好好学习,天天向上呢?
去问各科老师,那英语老师就会说:你肯定要学好英语啊,学好英语才能看到更大的世界!数学、物理、化学老师齐刷刷的说:学好数理化,走遍天下都不怕!
所以支小助内部其实是有一个专业团队在做事情,怎么能不强大呢?
如果你喜欢这种有趣又带有干货的文章,不要忘了点赞加关注,我们下一篇再见!
本文由 @雨辰的梦语 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务
AI如何支棱起来?不断学习,深度训练,创新应用,AI的潜力无穷无尽!
通过具体的案例来展示AI的实际应用,比如你提到的谷歌NotebookLM,可以更详细地描述这个案例,让读者感受到AI的实际价值。