ChatGPT vs. Microsoft Copilot vs. Gemini,到底哪个好?
在过去一年里,AI工具的出现一定程度上改变了我们的工作和生活方式,那么,这些AI工具,谁更靠谱?不妨来看看本文的一个测评结果。
人工智能(AI)在过去的一年里彻底改变了我们的工作和娱乐方式,几乎任何人都能够编写代码、创造艺术甚至进行投资。
不管是对于专业还是业余的使用者,生成式AI工具,如ChatGPT,给我们提供了从简单提示到创建高质量内容的高级能力。
随着Microsoft将GPT-4添加到Bing并将其更名为Copilot,OpenAI为ChatGPT增加了新功能,以及Bard被整合进谷歌生态系统并重新品牌为Gemini,AI工具的更新迭代越来越快了。
那么:Microsoft Copilot Pro 与 OpenAI的ChatGPT Plus以及谷歌的Gemini:你认为哪个值得你每月花20刀?我测试了这三个AI chatbot,一起来看看结果。
测试ChatGPT、Microsoft Copilot、Gemini。
首先我用了一个简单的逻辑问题来对比:
我今天有5个橙子,上周我吃了3个橙子。我还剩下多少个橙子?
答案应该是五个,因为我上周吃了多少个橙子并不影响我今天有多少个橙子,可以用这个来测试一下三个AI工具的逻辑能力。
一、首先是ChatGPT测试
ChatGPT于2022年11月发布。自发布开始,这款AI chatbot迅速获得了超过1亿用户,仅网站每月就有18亿访问者。也一直是舆论的焦点,几乎每个新的AI工具发布出来都声称“远超 ChatGPT ”,ChatGPT俨然已成为行业的标杆。
我几乎每天都在使用ChatGPT,帮我解决了很多棘手的问题。
ChatGPT 3.5的结果:
ChatGPT 3.5 给出了一个错误的答案
二、ChatGPT 4.0
ChatGPT 4.0 给出了正确的答案
ChatGPT 4.0 正确理解了问题的完整上下文并给出了正确答案。免费的3.5版本的逻辑能力确实不如4.0。GPT-4据说拥有超过100万亿条数据;GPT-3.5有1750亿条数据。更多的数据本质上意味着模型是基于更多数据进行训练的,这使得它更有可能准确地回答问题,减少错误的可能性。
如果用GPT的话,更推荐使用4.0版本,不管是在功能上还是在回答的结果质量上都甩ChatGPT3.5好几条街。不过需要注意的是ChatGPT有条数限制是三个小时40条,如果超出了这个条数就需要等。
目前GPT4(ChatGPT Plus)账号支持的功能还包括:海量插件 实时联网 语音对话 图片识别 文件上传 数据分析能力 绘图功能 代码解析功能 自定义指令。
三、Microsoft Copilot 测试
接下来,我们来测试一下Microsoft Copilot(原名Bing chat),它其实相当于免费的低配版ChatGPT 4.0,已经把ChatGPT整合进了它的新Bing模型中。
与ChatGPT 3.5 相比,Copilot可以联网来提供更当前的信息并附带信息来源。另外,Copilot由GPT-4驱动,是OpenAI的LLM,并且可以完全免费使用。美中不足的是,一次对话中只能有五个回答,并且每个提示最多只能输入2000个字符。
Copilot的精确对话风格准确回答了问题
Copilot的用户界面不如ChatGPT那样直观,但它也比较易于导航,Bing Chat可以联网,可以得到比ChatGPT 3.5更新的结果,但我发现它比起ChatGPT更容易卡顿,有时候会漏掉一些指令。
如果你喜欢有更多的视觉特性,可以选择Copilot。
通过对平台的一系列升级,Microsoft在Copilot中添加了视觉特性。当问Copilot问题的时候,比如我问它”Tasmanian devil是什么?”,它给我的回复是一个信息卡片,包括照片、寿命、饮食等,这比起一大堆文字更容易让人理解。
Copilot的回复
它还可以生成图片,你只需要给它一个指令,就可以得到四张图像。
Microsoft Copilot可以选择不同的对话风格,包括Creative、Balanced和Precise,这些风格都会影响沟通交流的对话风格。
Creative风格的回复结果
Balanced风格的回复结果
但是很明显,Microsoft Copilot中的Balanced和Creative对话风格的逻辑能力更弱一些,都没有准确回答我的问题。
最后,让我们来看看谷歌的Gemini,以前的Bard,它使用了不同的LLM,并在过去几个月中进行了大力升级。
如果你想要一个快速、几乎无限制的体验,你可以试试Gemini。
现在 Gemini 相较于Bard有了巨大的改进。Gemini 的回答速度很快,并且可以根据深入的沟通给出更加精确的答案,它的响应速度比ChatGPT Plus慢,比Copilot要快。
Bard 的回答:
Bard 的回答
Gemini准确地回答了问题,说明它的逻辑能力还是很不错的。
而在此之前的Bard版本的答案是剩下2个橘子,由此可见Gemini的更新在逻辑上的进步很大。
Gemini没有回应数量的限制。你可以与谷歌的Gemini进行长时间的对话,而Bing和ChatGPT 4.0 都有条数的限制。
如果你想要完整的谷歌体验,可以选择Gemini。
谷歌还将更多的视觉元素纳入了Gemini平台,比目前在Copilot上可用的要多。用户还可以使用Gemini生成图像,可以通过与谷歌镜头的整合上传照片,并享受Kayak、OpenTable、Instacart和Wolfram Alpha插件。
另外,Extensions将广泛的谷歌应用程序整合进了Gemini,Gemini现在正在逐渐增强完整的谷歌体验。Gemini用户只需要在Gemini的对话框@对应的谷歌工具,比如谷歌工作区、YouTube、谷歌地图、谷歌航班和谷歌酒店等,从而享受更加个性化的体验。
调用谷歌maps
本文由 @AI魔法学园 原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
- 目前还没评论,等你发挥!