Agent 测评:Manus vs TARS vs Genspark vs Flowith

VerTig0
0 评论 666 浏览 1 收藏 15 分钟
🔗 产品经理在不同的职业阶段,需要侧重不同的方面,从基础技能、业务深度、专业领域到战略规划和管理能力。

随着AI技术的飞速发展,AI Agent(智能体)逐渐成为改变生活与工作的重要工具。本文将对四款热门的AI Agent产品——Manus、TARS、Genspark和Flowith进行全面测评,分析它们的核心功能、优点与缺点,并探讨其在企业级应用中的潜力与挑战。

2025 年涌现了一大批 Agent 产品,让 AI 从从简单的聊天工具进化成了能够改变生活与工作的“AI Agent”。AI Agent是⼀种能够感知环境、做出决策并采取⾏动以实现特定⽬标的智能系统。现代基于⼤语⾔模型的 AI Agent 通常具备以下” 四件套” 特点:

这四项核心能力相互配合,使 AI Agent 能够处理各种复杂任务,从简单的信息检索到复杂的决策分析,甚至是跨领域的创造性工作。与传统的对话式AI助手相比,AI Agent 具有更强的自主性和目标导向性,能够主动规划并执行任务,而不仅仅是被动地回应用户请求。

01 Manus

产品介绍

Manus 是由中国团队 Monica.im 开发的通用型自主AI Agent(智能体),他的工作原理是基于底层 AI 大模型的能力基础,通过自主任务分解将复杂任务拆解为多个子任务,并动态调用不同的 Agent 或工具来执行每个子任务,最终完成整体任务。Manus采用Multiple Agent架构,运行在独立虚拟机中,能够调用多种工具执行任务。其核心是”知行合一”的理念,不仅能思考,还能直接执行任务并交付结果。

Manus 在 GAIA Benchmark 上评分高于 openai 的 Deep Research(GAIA Benchmark是由 Meta AI、Hugging face 等机构制定的一个包含 466 道问题的一个通用人工智能助手的基准测试)

核心功能

  • 自主规划能力:能够自主理解任务,拆分为子任务并规划执行步骤
  • 代码执行:可以编写和执行代码,解决编程和数据分析问题
  • 网络搜索:能够自主进行网络搜索,获取最新信息
  • 数据分析与可视化:处理数据并生成图表和报告
  • 内容创作:撰写文章、报告和营销材料等

优点

  • 自主性极高,能够独立完成复杂任务
  • 工具调用能力强,支持多种外部工具
  • 执行过程透明,可以通过虚拟机观察其每一步的操作流程
  • 交付成果质量高,接近专业人员水平

缺点

  • 不开源,技术细节不透明
  • 缺乏官方API,难以集成到企业系统
  • 多模态交互能力有待提升
  • 任务执行速度较慢

实际使用示例

AI Agent产品对比分析与结论 – Manus

02 TARS

产品介绍

Agent TARS是字节跳动开源的多模态AI Agent框架,基于UI-TARS(视觉语言模型)构建,支持通过自然语言控制计算机。它采用开放架构,支持模型上下文协议(MCP),使其具有良好的扩展性。

核心功能

  • 浏览器操作:执行深度研究和网页操作,如表单填写、点击等
  • 命令行集成:与终端交互,执行系统命令
  • 文件编辑:创建、修改和管理文件系统中的文档
  • 视觉理解:理解屏幕内容,进行基于GUI的操作
  • 支持MCP:可以灵活切换使用不同的 MCP 工具来提升工作效率。

优点

  • 完全开源,可自由修改和部署
  • 多模态交互能力强,尤其是视觉理解
  • 扩展性好,支持自定义功能
  • 与操作系统深度集成,可控制任何GUI应用

缺点

  • 稳定性和性能不如商业闭源产品,经常出现不执行任务的情况
  • 目前很多网页有反爬机制,导致其经常会卡在真人校验中
  • 最终输出内容质量较低,对于复杂任务无法直接应用
  • 需要本地计算资源并且会操控本地电脑,存在一定的合规风险

03 Genspark

产品介绍

GenSpark 是由创始人景鲲打造的一款 Agent 产品。这款产品最初以AI驱动的搜索工具起家,如今已升级为“全能型AI代理”,目标是通过速度、精准性和用户可控性,解决从日常琐事到复杂需求的各种任务。它不仅能快速响应用户指令,还能主动执行现实世界的操作,例如拨打电话预订服务,展现出强大的实用性。

Genspark Super Agent采用多智能体混合系统架构,整合了8个不同规模的大型语言模型(LLMs),每个模型针对特定任务进行了优化。系统还集成了超过80种内部工具和多个精选数据集,实现了高度自主性。在GAIA基准测试中表现优异,超过了行业标杆Manus。

核心功能

  • AI电话功能:这是GenSpark最具创新性的特性之一。它内置语音合成技术,能模拟人类与服务提供商沟通,处理预订、查询甚至退换货等任务,堪称“现实世界的代言人”
  • 多模态输出:GenSpark不仅限于文本生成,还能输出PPT演示文稿、短视频甚至南派风格的动画。例如,它可以根据指令制作一段科技新闻短视频,配上字幕和配音,直接用于社交媒体发布
  • Sparkpage页面:类似维基百科的结构化页面,将零散信息整合为清晰的概览,方便用户快速获取重点

优点

  • 功能全面,覆盖从规划到执行的全流程
  • 电话功能是独特优势,弥补了纯文本交互的局限
  • 执行速度快,效率高
  • 相较于其他产品,Genspark可支持更多任务,适应不同业务需求

缺点

  • 自主型较弱,复杂任务需要用户的引导下执行
  • 文生图、文生视频任务直接调用第三方接口实现,与平台能力关联性不大
  • 开放程度低于完全开源产品

实际使用示例

https://www.genspark.ai/agents?id=e3cce956-6481-43c4-b3dc-1a715e0cba49

04 Flowith

Flowith 是一个画布式 AI 创作平台,2024 年初开始布局 agent 方向,2024 年 8 月正式上线了 agent 框架——Flowith Oracle,这比 OpenAI 的 o1 模型还要早。至今,Oracle 已经解决了超过 2000 万次复杂问题。

Flowith Oracle mode 采用独特的agenic knowledge management框架。它能自动将用户上传的信息拆分为knowledge seed,并实现知识的循环系统。核心是自主规划引擎,支持任务分解和无限工具调用。

核心功能

  • 任务自主规划与分解:将复杂需求拆解为有序子任务(Recipe),设计系统性工作流
  • 无限制工具调用:调用丰富工具库完成子任务
  • 知识花园:构建个性化知识库,管理和应用知识(类似 ima)
  • 多线程画布:在一个画布中与多个AI模型同时交互,用户可以在Agent运行过程中添加/删除任务

优点

  • 创新的画布式界面,交互体验优秀
  • 知识管理能力强,支持知识循环系统
  • 任务执行中可定制化程度极高,适应各种创意场景
  • 工具调用能力出色,支持复杂任务

缺点

  • 运行模式与常规 Agent 产品有差异,新用户适应需要时间
  • 多模态支持相对较弱
  • 开放性不如完全开源产品

实际使用示例

https://flowith.io/conv/b904a02a-6253-4115-a6bd-45b30c5fd379?U2FsdGVkX19DcSHIWDq4dvaFdJ9ygn7/PCHjQBDnkynUdkAMguCXA5YwLtgtespdT8IGXj7qKTw4wsgJ07oOHw==

05 产品对比

B端应用场景分析

在企业应用方面,Agent 有望在以下领域率先落地:

研究表明,AI Agent在B端最有可能率先落地的是部门级应用,而非公司级应用。这是因为部门级工作相对灵活,存在大量未被固化的业务流程,而这恰恰是AI Agent能够发挥优势的地方。

落地挑战与制约因素

尽管Agent在B端市场有巨大潜力,但当前仍面临一系列挑战:

技术层面

  • 幻觉问题:AI生成的内容存在事实错误的风险
  • 复杂任务处理能力有限,常需人工介入
  • 安全与隐私保障机制不足
  • 系统集成困难,与企业现有系统兼容性问题

非技术层面

  • 缺乏明确的监管框架和合规标准
  • 投资回报率(ROI)不明确
  • 责任归属不清晰,出错时责任界定困难

结论与建议

1)对Agent市场不要过于FOMO

尽管AI Agent市场展现出强劲的增长潜力和广阔的应用前景,但目前的产品还不足以在B端市场中大规模应用。从技术成熟度、稳定性、安全性以及与现有企业系统的集成能力来看,当前的AI Agent产品仍处于早期阶段。

建议企业保持理性,避免因”错失恐惧”(FOMO)而仓促决策。可以采取试点项目和小规模实验的方式,逐步引入Agent技术,评估其在特定业务场景下的实际效果,为未来更大规模的部署积累经验。

2)相信”壳”的力量

即使没有能力优化底层模型算法,企业也可以通过打造优秀的产品”壳”来创造价值。在当前阶段,基础大模型能力正在迅速成为通用化服务,真正的差异化竞争优势将来自于:

  • 用户友好的交互界面设计
  • 针对特定场景的工作流程优化
  • 与企业现有系统的无缝集成
  • 垂直领域的专业知识积累
  • 安全合规的数据处理机制

企业应将重点放在应用层面的创新上,通过深入理解用户需求,设计出符合特定场景的AI Agent解决方案,而非过度关注底层技术的迭代。

3)AI能力没有壁垒,方向比技术更重要

在AI快速发展的今天,技术正在以前所未有的速度被开源和共享。基础AI能力不再是核心竞争力,而是找准方向和应用场景的能力变得更为关键。

企业应该培养对市场趋势的敏感性,找到AI Agent技术与自身业务的最佳结合点。即使是小团队,只要找准方向,也有可能开发出成功的产品。不要被技术复杂性而被恐吓住,关注解决实际问题的能力。

展望未来

展望未来,我们预计AI Agent技术将在以下几个方向快速发展:

  • 多智能体协作:从单一Agent向多Agent协作系统演进,处理更复杂的任务
  • 垂直领域专精:针对特定行业的专业化Agent将出现,具备深度专业知识
  • 人机协作模式优化:更自然、高效的人机交互方式,提高协作效率
  • 安全与隐私保障机制完善:更强的安全机制和隐私保护功能
  • 标准化与互操作性提升:不同Agent系统之间的标准接口和协作机制

AI Agent技术正处于从概念验证到实际应用的关键转折点。企业需要理性看待其潜力和局限,在保持技术敏感性的同时,着眼于解决实际业务问题,才能真正从这一技术浪潮中受益。

本文由 @VerTig0 原创发布于人人都是产品经理。未经作者许可,禁止转载

题图来自Unsplash,基于CC0协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!
专题
16970人已学习14篇文章
图标是用户页面不可缺少的元素,本专题的文章分享了图标设计指南。
专题
13062人已学习12篇文章
要想判断一个行业的趋势,就要做好行业分析。本专题的文章分享了如何撰写行业分析报告。
专题
15334人已学习16篇文章
UML(统一建模语言)是由一系列标准化图形符号组成的建模语言,用于描述软件系统分析、设计和实施中的各种模型。本专题的文章分享了各类UML图的相关语法和整体解读。
专题
15386人已学习12篇文章
本专题的文章分享了数据产品经理的通用技能。
专题
14996人已学习13篇文章
在产品的商业模式中,广告变现占据了很大的比重,那么广告功能就是产品里面非常重要的功能之一。本专题的文章分享了如何搭建广告投放系统。