Agent 测评：Manus vs TARS vs Genspark vs Flowith

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

开通会员

发布

Agent 测评：Manus vs TARS vs Genspark vs Flowith

VerTig0

2025-04-16

0 评论 666 浏览 1 收藏

产品经理在不同的职业阶段，需要侧重不同的方面，从基础技能、业务深度、专业领域到战略规划和管理能力。

随着AI技术的飞速发展，AI Agent（智能体）逐渐成为改变生活与工作的重要工具。本文将对四款热门的AI Agent产品——Manus、TARS、Genspark和Flowith进行全面测评，分析它们的核心功能、优点与缺点，并探讨其在企业级应用中的潜力与挑战。

2025 年涌现了一大批 Agent 产品，让 AI 从从简单的聊天工具进化成了能够改变生活与工作的“AI Agent”。AI Agent是⼀种能够感知环境、做出决策并采取⾏动以实现特定⽬标的智能系统。现代基于⼤语⾔模型的 AI Agent 通常具备以下” 四件套” 特点：

这四项核心能力相互配合，使 AI Agent 能够处理各种复杂任务，从简单的信息检索到复杂的决策分析，甚至是跨领域的创造性工作。与传统的对话式AI助手相比，AI Agent 具有更强的自主性和目标导向性，能够主动规划并执行任务，而不仅仅是被动地回应用户请求。

01 Manus

产品介绍

Manus 是由中国团队 Monica.im 开发的通用型自主AI Agent（智能体），他的工作原理是基于底层 AI 大模型的能力基础，通过自主任务分解将复杂任务拆解为多个子任务，并动态调用不同的 Agent 或工具来执行每个子任务，最终完成整体任务。Manus采用Multiple Agent架构，运行在独立虚拟机中，能够调用多种工具执行任务。其核心是”知行合一”的理念，不仅能思考，还能直接执行任务并交付结果。

B端产品经理的能力模型与学习提升

B端产品经理面临的第一大挑战，是如何正确的分析诊断业务问题。这也是最难的部分，产品设计知识对这部分工作基本没有帮助，如果想做好业务分析诊断，必须具备扎实 ...

查看详情 >

Manus 在 GAIA Benchmark 上评分高于 openai 的 Deep Research（GAIA Benchmark是由 Meta AI、Hugging face 等机构制定的一个包含 466 道问题的一个通用人工智能助手的基准测试）

核心功能

自主规划能力：能够自主理解任务，拆分为子任务并规划执行步骤
代码执行：可以编写和执行代码，解决编程和数据分析问题
网络搜索：能够自主进行网络搜索，获取最新信息
数据分析与可视化：处理数据并生成图表和报告
内容创作：撰写文章、报告和营销材料等

优点

自主性极高，能够独立完成复杂任务
工具调用能力强，支持多种外部工具
执行过程透明，可以通过虚拟机观察其每一步的操作流程
交付成果质量高，接近专业人员水平

缺点

不开源，技术细节不透明
缺乏官方API，难以集成到企业系统
多模态交互能力有待提升
任务执行速度较慢

实际使用示例

AI Agent产品对比分析与结论 – Manus

02 TARS

产品介绍

Agent TARS是字节跳动开源的多模态AI Agent框架，基于UI-TARS(视觉语言模型)构建，支持通过自然语言控制计算机。它采用开放架构，支持模型上下文协议(MCP)，使其具有良好的扩展性。

核心功能

浏览器操作：执行深度研究和网页操作，如表单填写、点击等
命令行集成：与终端交互，执行系统命令
文件编辑：创建、修改和管理文件系统中的文档
视觉理解：理解屏幕内容，进行基于GUI的操作
支持MCP：可以灵活切换使用不同的 MCP 工具来提升工作效率。

优点

完全开源，可自由修改和部署
多模态交互能力强，尤其是视觉理解
扩展性好，支持自定义功能
与操作系统深度集成，可控制任何GUI应用

缺点

稳定性和性能不如商业闭源产品，经常出现不执行任务的情况
目前很多网页有反爬机制，导致其经常会卡在真人校验中
最终输出内容质量较低，对于复杂任务无法直接应用
需要本地计算资源并且会操控本地电脑，存在一定的合规风险

03 Genspark

产品介绍

GenSpark 是由创始人景鲲打造的一款 Agent 产品。这款产品最初以AI驱动的搜索工具起家，如今已升级为“全能型AI代理”，目标是通过速度、精准性和用户可控性，解决从日常琐事到复杂需求的各种任务。它不仅能快速响应用户指令，还能主动执行现实世界的操作，例如拨打电话预订服务，展现出强大的实用性。

Genspark Super Agent采用多智能体混合系统架构，整合了8个不同规模的大型语言模型(LLMs)，每个模型针对特定任务进行了优化。系统还集成了超过80种内部工具和多个精选数据集，实现了高度自主性。在GAIA基准测试中表现优异，超过了行业标杆Manus。

核心功能

AI电话功能：这是GenSpark最具创新性的特性之一。它内置语音合成技术，能模拟人类与服务提供商沟通，处理预订、查询甚至退换货等任务，堪称“现实世界的代言人”
多模态输出：GenSpark不仅限于文本生成，还能输出PPT演示文稿、短视频甚至南派风格的动画。例如，它可以根据指令制作一段科技新闻短视频，配上字幕和配音，直接用于社交媒体发布
Sparkpage页面：类似维基百科的结构化页面，将零散信息整合为清晰的概览，方便用户快速获取重点