AI搜索,一键直达答案

0 评论 361 浏览 2 收藏 11 分钟

AI技术的介入,为搜索领域带来了革命性的变革。本文通过深入分析“天工AI搜索”、“夸克”和“元宝搜索”等AI搜索功能,探讨了它们如何利用先进的算法和大数据分析,为用户提供更精准、更直观的搜索结果。

时间,是怎样被无情吞噬?

输入关键词、在一长串网页结果中点击浏览、规避隐藏的广告,甚至有时还得看个视频才能找到想要的结果。这是传统的搜索引擎,为了找到自己想要的答案,不得不耗费大量时间和精力大海捞针,是让人着急的体验。

搜索的下半场,是AI。

昆仑万维发布国内第一款AI搜索引擎“天工AI搜索”;夸克推出以AI搜索为中心的一站式AI服务;腾讯元宝上线深度搜索模式……大模型厂商们不约而同押注此方宝地,腾讯、百度、360等众多大厂均发布AI搜索产品或功能。

数据显示,当前在大模型相关产品的使用中,超过65%的用户需求集中于提升工作与学习效率,其中“搜索问答”需求占比高达45%。可以说,AI搜索颠覆了几十年来一成不变的搜索格局,一切变得简洁、高效,真是“懒人必备”。

一、搜常识,形式内容,缺一不可

医学、地理、历史、文学、物理……一搜索,无数纷繁复杂的信息扑面而来,需要自己甄别。当搜索融入了AI基因,能帮助用户选出最佳答案吗?

“红细胞和白细胞有什么区别”,这是天工、夸克和元宝得到的第一个问题。

天工参考了全网的12个信源,画出了一张表格,从大小、形状、颜色、主要功能等进行比较,比如白细胞直径10~15微米,可以进行免疫防御和炎症反应,红细胞直径7~8微米,主要运输氧气和二氧化碳。表格的形式让“小白”用户一目了然,并且还有简单的总结。如果觉得表格中的信息过于简单,想要了解更多,天工直接从一些医学网站上“拿来”相关内容,让用户自选。

夸克虽然没有给出表格,在形式上略逊于天工,参考资料也只有一篇,但从生理功能、临床意义、形态、数量等方面给出了两者的区别。像“临床意义”是天工没有提到的,白细胞计数偏低,可能是再生障碍性贫血、脾功能亢进症等引起,红细胞偏低可能是长期处于缺氧环境、真性红细胞增多症等引起。和天工一样,在给出答案后,又给出了不少其他平台上的信息。

元宝参考了11篇资料,同样从形态、数量、功能等方面替用户总结好了,甚至还有一些衍生问题,引导用户继续提问,比如“红细胞减少的常见原因是什么”“白细胞减少症的症状有哪些”等。虽然元宝也没有表格,但它给出了更多带有图片的链接,像微信公众号病理柳叶刀的《一图读懂红细胞VS白细胞》等。

从这个问题看,三大AI搜索平台的表现各有千秋,从形式上看,天工最为出新,从信息量上看,夸克略胜一筹,从问题衍生性看,元宝稍占上风。

回答完了医学问题,再回答一个地理问题:世界上最长的河流是哪一条,主要流经哪些国家?相较于上一道题,这道题的答案指向性比较单一。世界上最长的河流是尼罗河,天工除了给出这个答案,还告诉用户尼罗河的长度、发源地、对途经国家的作用等;元宝也抓住了问题的关键点,并且提出了不少延伸问题。但夸克却“拉垮”了,没能理解这道题,给出的答案是“埃及”,它把题目理解成了“世界上最长的河流在哪个国家”。

二、搜新闻,深层搜索,“卷”出天际

在信息爆炸的时代,搜索是获取新闻的重要窗口,但通常搜索一条新闻,会出现各种五花八门的消息,甚至还有“旧闻”掺杂其中,降低了搜索效率。

最近,关于“萝卜快跑”的新闻非常多,让这些AI搜索梳理一下吧。

天工综合了腾讯、百度等平台上4篇信源,总结出萝卜快跑近期有技术故障和识别能力不足等新闻,比较简单,也并不全面。

夸克同样也引用了4篇报道,相较于天工信息,其梳理得更为详细,比如把萝卜快跑和行人发生轻微接触的过程都写了出来,也总结了这起事故带来的后果。对于用户体验不佳的事,夸克蜻蜓点水般提了一下,并没有详细说明。

在这条新闻的梳理方面,元宝的表现明显占优,不仅参考的资料多,达到了10篇,还总结出了6件事情,分别是武汉街头无人驾驶汽车引发热议、日均订单量赶上出租车、与行人相撞、网络水军事件、面临安全挑战以及和真人司机“抢饭碗”,每一个事件都可以跳转到相关网站查看详细报道。

对于萝卜快跑的消息,这三个平台在梳理完后,都给出了一些延伸问题,比如萝卜快跑的技术故障是什么原因引起的、萝卜快跑何时将覆盖更多的城市、萝卜快跑的订单量增长对传统出租车行业有何影响等……

大模型是需要“教导”的,天工第一次给出的答案是三个平台中最简单的,被要求“重答”后,它认真了一点,不仅梳理的信息更加多元,包括交通故障、服务问题投诉、公众对萝卜快跑的态度等,还进行了分类,看上去更加清晰。

在此轮中表现不错的元宝非常“卷”,其有“深度研究该问题”功能,就这个问题,元宝参考了53篇资料,相较于一开始的10篇增加了43篇。深度回答在内容方面也更加详细,以萝卜快跑在武汉发生的交通事故为例,不仅有事故概况,还分析了责任问题和回应措施。值得一提的是,元宝用一张脑图展现了深度梳理出的信息,看起来更为直观。

三、搜观点,思想火花,各抒己见

想法不碰撞,就像花儿不斗艳,少了那份活力和色彩。大多数事件都会产生各种不同的观点和看法,在信息时代,搜索观点变得尤为重要,这些AI搜索能挖掘出深藏于网络的思想宝藏吗?

“大模型如雨后春笋般涌现,现在的大模型好用吗?”这是一个仁者见仁智者见智的问题。

面对这个问题,天工给自己做起了广告,说“天工大模型”的设计和优化都是基于最新的技术进展和用户反馈,通过不断的学习和迭代,可以成为用户信赖的伙伴。

这显然不是记者想要的答案,虽然在“相关资讯”中,天工提供了不少和大模型相关的报告和观点,但这些信息都比较零散,需要自己梳理。

元宝依然参考了最多的资料,总结了各类评测结果,但给出的答案主要侧重于大模型的优点。比如根据浙江大学、香港中文大学的一些评测结果显示,大型语言模型在专业领域知识测试中表现优秀,多个大模型的中文能力超过了GPT—3.5。

在用户反馈方面,元宝得出的结论是大语言模型在意图识别和内容结果呈现方面表现良好,能够提供全面深入的信息。

虽然这样的结论有其合理性,但大模型毕竟还处于发展上升阶段,有许多不足之处。

在这个问题上,夸克提炼出的观点更为中立,除了肯定大模型在能力、易用性、效率等方面的优势,也直言不讳地表示,目前大模型在安全性、隐私保护、能力提升等方面依然有进步的空间,比如“用户担心个人数据可能被滥用,或者模型可能被用于不道德或非法目的,目前,大模型仍处于发展初期,还面临诸多挑战和限制”等。

总之,这些AI搜索应用在接受“拷问”时展现了不同的优势,但也会有“迷糊”的时候。当然,每一次“迷糊”可能是它们迈向更智能、更完善的一步。

作者/ IT时报记者 潘少颖
编辑/ 潘少颖 孙妍
本文由人人都是产品经理作者【IT时报】,微信公众号:【IT时报】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!