Agent 测评:Manus vs TARS vs Genspark vs Flowith
随着AI技术的飞速发展,AI Agent(智能体)逐渐成为改变生活与工作的重要工具。本文将对四款热门的AI Agent产品——Manus、TARS、Genspark和Flowith进行全面测评,分析它们的核心功能、优点与缺点,并探讨其在企业级应用中的潜力与挑战。
2025 年涌现了一大批 Agent 产品,让 AI 从从简单的聊天工具进化成了能够改变生活与工作的“AI Agent”。AI Agent是⼀种能够感知环境、做出决策并采取⾏动以实现特定⽬标的智能系统。现代基于⼤语⾔模型的 AI Agent 通常具备以下” 四件套” 特点:
这四项核心能力相互配合,使 AI Agent 能够处理各种复杂任务,从简单的信息检索到复杂的决策分析,甚至是跨领域的创造性工作。与传统的对话式AI助手相比,AI Agent 具有更强的自主性和目标导向性,能够主动规划并执行任务,而不仅仅是被动地回应用户请求。
01 Manus
产品介绍
Manus 是由中国团队 Monica.im 开发的通用型自主AI Agent(智能体),他的工作原理是基于底层 AI 大模型的能力基础,通过自主任务分解将复杂任务拆解为多个子任务,并动态调用不同的 Agent 或工具来执行每个子任务,最终完成整体任务。Manus采用Multiple Agent架构,运行在独立虚拟机中,能够调用多种工具执行任务。其核心是”知行合一”的理念,不仅能思考,还能直接执行任务并交付结果。
Manus 在 GAIA Benchmark 上评分高于 openai 的 Deep Research(GAIA Benchmark是由 Meta AI、Hugging face 等机构制定的一个包含 466 道问题的一个通用人工智能助手的基准测试)
核心功能
- 自主规划能力:能够自主理解任务,拆分为子任务并规划执行步骤
- 代码执行:可以编写和执行代码,解决编程和数据分析问题
- 网络搜索:能够自主进行网络搜索,获取最新信息
- 数据分析与可视化:处理数据并生成图表和报告
- 内容创作:撰写文章、报告和营销材料等
优点
- 自主性极高,能够独立完成复杂任务
- 工具调用能力强,支持多种外部工具
- 执行过程透明,可以通过虚拟机观察其每一步的操作流程
- 交付成果质量高,接近专业人员水平
缺点
- 不开源,技术细节不透明
- 缺乏官方API,难以集成到企业系统
- 多模态交互能力有待提升
- 任务执行速度较慢
实际使用示例
02 TARS
产品介绍
Agent TARS是字节跳动开源的多模态AI Agent框架,基于UI-TARS(视觉语言模型)构建,支持通过自然语言控制计算机。它采用开放架构,支持模型上下文协议(MCP),使其具有良好的扩展性。
核心功能
- 浏览器操作:执行深度研究和网页操作,如表单填写、点击等
- 命令行集成:与终端交互,执行系统命令
- 文件编辑:创建、修改和管理文件系统中的文档
- 视觉理解:理解屏幕内容,进行基于GUI的操作
- 支持MCP:可以灵活切换使用不同的 MCP 工具来提升工作效率。
优点
- 完全开源,可自由修改和部署
- 多模态交互能力强,尤其是视觉理解
- 扩展性好,支持自定义功能
- 与操作系统深度集成,可控制任何GUI应用
缺点
- 稳定性和性能不如商业闭源产品,经常出现不执行任务的情况
- 目前很多网页有反爬机制,导致其经常会卡在真人校验中
- 最终输出内容质量较低,对于复杂任务无法直接应用
- 需要本地计算资源并且会操控本地电脑,存在一定的合规风险
03 Genspark
产品介绍
GenSpark 是由创始人景鲲打造的一款 Agent 产品。这款产品最初以AI驱动的搜索工具起家,如今已升级为“全能型AI代理”,目标是通过速度、精准性和用户可控性,解决从日常琐事到复杂需求的各种任务。它不仅能快速响应用户指令,还能主动执行现实世界的操作,例如拨打电话预订服务,展现出强大的实用性。
Genspark Super Agent采用多智能体混合系统架构,整合了8个不同规模的大型语言模型(LLMs),每个模型针对特定任务进行了优化。系统还集成了超过80种内部工具和多个精选数据集,实现了高度自主性。在GAIA基准测试中表现优异,超过了行业标杆Manus。
核心功能
- AI电话功能:这是GenSpark最具创新性的特性之一。它内置语音合成技术,能模拟人类与服务提供商沟通,处理预订、查询甚至退换货等任务,堪称“现实世界的代言人”
- 多模态输出:GenSpark不仅限于文本生成,还能输出PPT演示文稿、短视频甚至南派风格的动画。例如,它可以根据指令制作一段科技新闻短视频,配上字幕和配音,直接用于社交媒体发布
- Sparkpage页面:类似维基百科的结构化页面,将零散信息整合为清晰的概览,方便用户快速获取重点
优点
- 功能全面,覆盖从规划到执行的全流程
- 电话功能是独特优势,弥补了纯文本交互的局限
- 执行速度快,效率高
- 相较于其他产品,Genspark可支持更多任务,适应不同业务需求
缺点
- 自主型较弱,复杂任务需要用户的引导下执行
- 文生图、文生视频任务直接调用第三方接口实现,与平台能力关联性不大
- 开放程度低于完全开源产品
实际使用示例
https://www.genspark.ai/agents?id=e3cce956-6481-43c4-b3dc-1a715e0cba49
04 Flowith
Flowith 是一个画布式 AI 创作平台,2024 年初开始布局 agent 方向,2024 年 8 月正式上线了 agent 框架——Flowith Oracle,这比 OpenAI 的 o1 模型还要早。至今,Oracle 已经解决了超过 2000 万次复杂问题。
Flowith Oracle mode 采用独特的agenic knowledge management框架。它能自动将用户上传的信息拆分为knowledge seed,并实现知识的循环系统。核心是自主规划引擎,支持任务分解和无限工具调用。
核心功能
- 任务自主规划与分解:将复杂需求拆解为有序子任务(Recipe),设计系统性工作流
- 无限制工具调用:调用丰富工具库完成子任务
- 知识花园:构建个性化知识库,管理和应用知识(类似 ima)
- 多线程画布:在一个画布中与多个AI模型同时交互,用户可以在Agent运行过程中添加/删除任务
优点
- 创新的画布式界面,交互体验优秀
- 知识管理能力强,支持知识循环系统
- 任务执行中可定制化程度极高,适应各种创意场景
- 工具调用能力出色,支持复杂任务
缺点
- 运行模式与常规 Agent 产品有差异,新用户适应需要时间
- 多模态支持相对较弱
- 开放性不如完全开源产品
实际使用示例
05 产品对比
B端应用场景分析
在企业应用方面,Agent 有望在以下领域率先落地:
研究表明,AI Agent在B端最有可能率先落地的是部门级应用,而非公司级应用。这是因为部门级工作相对灵活,存在大量未被固化的业务流程,而这恰恰是AI Agent能够发挥优势的地方。
落地挑战与制约因素
尽管Agent在B端市场有巨大潜力,但当前仍面临一系列挑战:
技术层面
- 幻觉问题:AI生成的内容存在事实错误的风险
- 复杂任务处理能力有限,常需人工介入
- 安全与隐私保障机制不足
- 系统集成困难,与企业现有系统兼容性问题
非技术层面
- 缺乏明确的监管框架和合规标准
- 投资回报率(ROI)不明确
- 责任归属不清晰,出错时责任界定困难
结论与建议
1)对Agent市场不要过于FOMO
尽管AI Agent市场展现出强劲的增长潜力和广阔的应用前景,但目前的产品还不足以在B端市场中大规模应用。从技术成熟度、稳定性、安全性以及与现有企业系统的集成能力来看,当前的AI Agent产品仍处于早期阶段。
建议企业保持理性,避免因”错失恐惧”(FOMO)而仓促决策。可以采取试点项目和小规模实验的方式,逐步引入Agent技术,评估其在特定业务场景下的实际效果,为未来更大规模的部署积累经验。
2)相信”壳”的力量
即使没有能力优化底层模型算法,企业也可以通过打造优秀的产品”壳”来创造价值。在当前阶段,基础大模型能力正在迅速成为通用化服务,真正的差异化竞争优势将来自于:
- 用户友好的交互界面设计
- 针对特定场景的工作流程优化
- 与企业现有系统的无缝集成
- 垂直领域的专业知识积累
- 安全合规的数据处理机制
企业应将重点放在应用层面的创新上,通过深入理解用户需求,设计出符合特定场景的AI Agent解决方案,而非过度关注底层技术的迭代。
3)AI能力没有壁垒,方向比技术更重要
在AI快速发展的今天,技术正在以前所未有的速度被开源和共享。基础AI能力不再是核心竞争力,而是找准方向和应用场景的能力变得更为关键。
企业应该培养对市场趋势的敏感性,找到AI Agent技术与自身业务的最佳结合点。即使是小团队,只要找准方向,也有可能开发出成功的产品。不要被技术复杂性而被恐吓住,关注解决实际问题的能力。
展望未来
展望未来,我们预计AI Agent技术将在以下几个方向快速发展:
- 多智能体协作:从单一Agent向多Agent协作系统演进,处理更复杂的任务
- 垂直领域专精:针对特定行业的专业化Agent将出现,具备深度专业知识
- 人机协作模式优化:更自然、高效的人机交互方式,提高协作效率
- 安全与隐私保障机制完善:更强的安全机制和隐私保护功能
- 标准化与互操作性提升:不同Agent系统之间的标准接口和协作机制
AI Agent技术正处于从概念验证到实际应用的关键转折点。企业需要理性看待其潜力和局限,在保持技术敏感性的同时,着眼于解决实际业务问题,才能真正从这一技术浪潮中受益。
本文由 @VerTig0 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务
- 目前还没评论,等你发挥!