深度剖析鹅厂AI:腾讯元宝

2 评论 4108 浏览 19 收藏 30 分钟

随着人工智能技术的飞速发展,AI产品正逐渐渗透到我们的日常生活和工作中。本文分析了腾讯元宝这款AI产品的产品特点、技术核心等内容,作者给到了自己的思考,为大家提供一个AI产品如何影响我们生活的案例。

Again,三白又来交付万字长文的商业研究分析了,本篇分享的是关于另一个AI产品腾讯元宝的深度分析报告,前面分享的《深度剖析字节豆包AI》《深度剖析字节coze/扣子》的两篇内容发布后获得了很多朋友的点赞,其中有不少朋友或者是正在准备AI赛道的求职面试,或者是企业内部正在探索和理解现有的AI产品,很荣幸能够帮助到大家,本来写作这个事情,主要还是我业余抽时间写写,很多用户的正向反馈让我有更高的激情愿意每次花几周的时间只写1篇深度内容;

今年的5月底腾讯元宝上线至今,我一直都在使用这款产品,体验它和豆包等之间的差异,也密切的关注这款产品的每一次更新和动向,过程中也有一些零散的思考,最近花了近2周左右的时间,把过去几个月的思考沉淀下来,分享给大家;

比较有趣的是,我在写豆包和扣子这两个产品的时候,花了将近1年左右的时间在积累内容,相比之下,写这篇文章还算快了一些。

全篇内容总字数8000+字,阅读预计需要15分钟,我将按照一个标准的产品分析报告的视角,系统的介绍和分享个人关于腾讯元宝这款产品的一些观察、分析、思考,我将从产品、商业、用户、竞品等多个角度综合分析这款鹅厂新产品。

1.全文内容的信息获取来源?

本篇文章全部内容和信息主要基于如下几个信息来源:

  • 个人基于长期对产品的关注、体验、思考而形成的个人观点;
  • 来自和腾讯、字节、百度、阿里等国内大厂的AI从业朋友的讨论与交流;
  • 参考市面上公开的各种资讯、专题分析、公开报道等;

2.适合哪些人群?

  • 想要系统的了解AI产品,建立行业认知的朋友;
  • AI产品经理和运营人员,特别是正在求职面试AI相关岗位和产品的朋友;
  • 研究AI和腾讯产品的金融研究人员;

一、腾讯元宝产品分析

1. 先来看看腾讯的AI和大模型布局情况

在开始聊元宝之前,我们先整体看一下腾讯目前在AI和大模型领域的布局情况,下图为个人吐血整理,信息量比较大请谨慎阅读;

腾讯目前在AI和大模型领域的具体布局情况如下,其中覆盖应用层、模型层、中间层和基础设施层,基本概括目前腾讯在AI这块的投入和进展,其中腾讯元宝算是独立于所有旧业务产品,单独推出的一款AI原生应用;

2. 腾讯元宝产品基本信息介绍

腾讯元宝是腾讯在今年5月底上线的一款对标ChatGPT、豆包、文心一言等的AI产品,组织架构上隶属于腾讯混元团队,其产品的前身可能是之前推出的混元助手,只不过之前混元助手只是以小程序和web的方式推出,并且并没有持续的做产品迭代,可见之前的混元助手更多的是一个试验产品,用于快速的作为混元大模型的应用出口,而真正的面向应用端的产品是腾讯元宝;

根据公开信息显示,腾讯在2024年2月和3月已申请注册多枚“腾讯元宝”商标,可见元宝的筹备开发时间应该是在今年的2月份左右;目前产品的核心功能主打AI搜索、AI对话、AI阅读等场景,相比豆包整体更加偏娱乐属性,元宝则更加明确的偏向效率属性,整体产品定位上,更像是一个偏效率的综合性AI工具平台;

3. 腾讯元宝的产品定位思考

1)腾讯元宝产品定位分析

从产品能力层面上看定位

一句话概括定位:对标ChatGPT,提升用户办公、学习、生活、创作等效率的AI工具平台;

目前重点打磨的产品能力:AI搜索能力、AI阅读能力、AI创作能力、多模态能力;从目前产品聚焦的重点能力上看,腾讯元宝的产品定位更加聚焦在效率层面,重点解决信息获取效率、创作效率、工作流效率等场景;

竞品有而元宝当前没有做的产品能力:包括豆包、文心一言等浓墨重彩做的语音聊天对话、智能体创建等功能目前在元宝内并没有相应的体现,可见元宝一方面暂时不做以语音聊天为主的AI虚拟社交领域的事情,也不在元宝内做智能体创建的事情;

从公司层面上看定位

  • 作为混元大模型的直接落地应用场景:组织架构上,腾讯元宝隶属于混元团队,和大模型研发归属在同一组织架构下,因此腾讯元宝将作为混元大模型的直接业务团队,可以在一个团队下一边做模型一边做应用,这样可以不用受限于其他业务团队,自己决策模型的应用场景
  • 作为公司大模型的门面,以及腾讯在AI应用层面的品牌门面:一方面公司需要通过腾讯元宝展示混元大模型的技术能力,同时面向应用端的市场,腾讯也要有一个能够对标竞品的AI产品,腾讯元宝会作为对标字节豆包、百度文心一言、阿里通义的标杆产品;
  • 作为公司内部AI应用的连接器:腾讯元宝将连接微信公众中、QQ、小程序、腾讯搜索、腾讯新闻等多个产品,整合公司多方的产品技术能力,输出多种多样的AI应用,另外也可以和公司内大部分其他业务合作,后续赋能其他业务产品;

与其他公司稍微不同的地方

跟豆包相比,腾讯元宝在公司内部的影响力可能相对更小一些:一方面豆包所属的flow团队,基本独立于字节的各个集团,可单独运作,而元宝只隶属于TEG下的一个业务;另外一方面字节可谓倾整个集团的力量在重点扶持豆包,且给到的关注和资源是相当多的,而元宝从目前的增长情况看,暂时给到的资源支持也相对少一些;

2)面向目标用户和使用场景

根据第三方数据平台观测,腾讯元宝的用户画像特征情况如下:

  1. 从年龄情况上看,18岁以下的用户基本很少,中小学生群体较少,主要以大学生、办公白领、银发人群为主,其中大学生群体(年龄18~25岁用户)占比预计25%,和豆包相比略低(豆包占比30%),办公族(年龄25~35岁)占比46%,和豆包相比更高(豆包占比36%),银发人群(年龄40岁以上)占比23%,和豆包相比明显更高(豆包占比8%);
  2. 从城市等级上看,元宝的用户主要以一二线城市为主,其中一线、新一线、二线城市用户占比将近60%,而互联网大盘用户占比仅46%,豆包的用户占比也是将近46%,可见元宝的用户一二线城市用户更多;

因此,目前在元宝还没有开启大规模投放之前,其主要用户还是以一二线城市的大学生、办公族为主,产品的主要使用场景也主要以大学生和办公族的高频需求为主,其中包括:

  1. AI提升学习效率:包括知识问答、教育等;
  2. AI提升信息获取效率:包括AI搜索、AI阅读总结;
  3. AI提升创作效率:包括图像创作、文本创作等;

4. 产品核心产品能力

1)腾讯元宝、豆包、文心一言核心产品功能对比

对比总结概括如下,详细看对比表格内容:

  1. AI搜索能力:整体上看,目前腾讯元宝主要重点聚焦在AI搜索领域,目前整体产品不管是从检索结果、索引数据、回答质量等方面都更加不错,目前豆包在搜索领域也有下不少功夫,但是个人认为索引质量还不够,而文心一言从使用体验上,感觉没怎么在这方面下功夫,整体体验一般;
  2. AI写作能力:豆包和元宝在AI写作领域有个性化的产品设计,包括支持大纲编辑,支持自定义参考资料,更贴合创作者的写作工作流,但是两者在生成结果的专业度和质量上还不够,所以是模型不够,工程来凑;但是文心一言基本没有太多的产品工程设计,模型直接输出的专业度和质量相比略好一些,但是缺乏RAG和工程设计是其短板;
  3. AI语音聊天功能:这个方面目前毋庸置疑豆包做的相对更好,从市面上的口碑和用户反馈,也相对更好;
  4. AI阅读功能:元宝和豆包不管在阅读结果的呈现,以及对内容识别的能力上都明显做的更好,而文心一言目前从体验下来目前可能还没有在这个领域下太多功夫;
  5. 智能体生态豆包和文心一言都相对有非常丰富的智能体规模,同时也有强大的智能体开发工具扣子,但是缺乏有口碑的明星智能体;元宝目前的智能体规模相对少一些,但是通过和外部平台合作,可能能诞生一些口碑更好的智能体;
  6. 多模态生成:目前字节在这个方面投入相对更多,包括图像生成、视频生成、音乐生成均有涉足,且表现也不错;而元宝的文生图能力个人觉得从准确度、质量表现等都还不错;
  7. AI应用场景:在垂直场景落地方面,豆包的布局最多,深度拓展多个应用领域,包括AI虚拟聊天、AI搜索、写作、阅读、图像生成、音乐生成、教育、办公等多种应用场景,覆盖更多的应用领域;而元宝则重点聚焦搜索、写作、阅读、生图,目前拓展的应用场景还不多;文心一言主要以通用能力为主,暂时没有垂直围绕细分场景做应用结合;
  8. 使用入口拓展:豆包在入口拓展方面最激进,除了小程序,基本大部分主流入口都布局了,包括APP、web、pc客户端、浏览器插件、电脑操作系统插件,全方面多个入口渗透用户的使用入口;

2)产品历史版本迭代

根据公开信息找到的元宝版本迭代如下,如有遗漏欢迎补充:

  • 5月30日,腾讯元宝上线,具备基础的问答和交互功能;
  • 6月10日,新增多轮对话能力,提升交互的连贯性和深度;
  • 6月20日,升级 AI 搜索及解析能力,支持单文档最长 1 千万的超长文处理,一次性最多能解析 50 个文档,每个文档最大是 100M,并能够一次性解析多个微信公众号链接、网址,支持 256k 的原生窗口上下文;
  • 7 月 2日,上线「深度搜索」模式;
  • 7月5日,推出 AI 绘画多轮对话优化功能,可更好地明确和细化创作方向与细节;
  • 7 月 16 日,上线了“3D角色梦工厂”玩法,腾讯元宝也是首个拥有打印级3D生成能力的通用大模型App;
  • 7月25日,推出面向日常生活场景的百变 AI 头像功能;
  • 8月10日,上线口语陪练功能;
  • 8月20日,推出超能翻译官功能;
  • 9月5日,腾讯元宝品牌智能体专区正式上线,首批邀请 11 家合作伙伴入驻,打造精品AI智能体应用生态,涵盖工作提效和生活娱乐多个场景

二、产品底层核心技术分析

腾讯元宝背后的核心技术主要包括混元大模型、混元文生图大模型、混元多模态模型,各模型的基础情况介绍如下:

1. 混元大模型

目前混元生文大模型已上线7个版本,自 2023 年 9 月首次亮相以来,腾讯混元大模型的参数规模从千亿级升级至万亿参数规模,预训练语料从万亿升级至 7 万亿 tokens,并率先升级为多专家模型结构(MoE),整体性能相比 Dense 版本提升超 50%。除不断提升通用大模型能力外,腾讯混元也支持角色扮演、FunctionCall、代码生成等领域能力,数理能力提升 50 %;

根据官方公布消息,目前腾讯内部有超 600 个业务及场景都已经接入腾讯混元,腾讯广告、微信读书、腾讯会议、腾讯文档、腾讯客服等,都已经基于混元实现了智能化升级;腾讯广泛的应用场景,也进一步反哺了大模型能力的提升。

混元大模型和国内外主要模型能力对比:

  1. 在基本参数方面,从模型参数规模上看,目前GPT4.0的参数规模预计应该是最高的,其训练数据规模个人猜测预计应该也是最高的,至于上下文长度,混元大模型目前最高支持256K为对比模型中最长;
  2. 对于模型综合表现方面,尽管目前国内有不少模型都生成达到或者超过GPT4.0的水平,但是从个人实际在应用接入的表现上看,GPT4.0的综合表现基本远远超过国内所有模型;
  3. 价格方面,目前价格最低的模型是豆包大模型,今年5月份的时候其主力模型把输出的价格下降了将近60倍,低至2元/百万token,这个对于行业应用的开发者而言真的是一个福音,从个人的角度上看,GPT4o的价格虽然贵,但是能力和定价匹配,豆包大模型的能力和GPT4o能力有差异,但是性价比高,但是文心大模型和混元大模型目前的价格目前属实太高,其定价基本对标GPT4o,站在开发者的角度上看,性价比不高;

2. 混元多模态模型

混元多模态模型支持图片生文,包括图片基础识别、图片内容创作、图片多轮对话、图片知识问答、图片分析推理、图片OCR等能力,以下为模型特性的简要介绍:

3. 混元生图

腾讯混元文生图大模型是业内首个中文原生 DiT 架构模型,采用了 Sora、Stable Diffusion 3 等行业顶尖产品的同款架构,生成效果相比上代提升超 20%。目前,该模型已经全面开源,在 Github 获得 2000+star,相关能力也全面融入腾讯元宝,此外,腾讯混元大模型在视频、3D 生成等方面也持续探索,目前已经支持 16s 视频生成,单图仅需 30 秒即可生成 3D 模型,相关能力也将于后续在元宝中上线;

4. 各模型定价情况

目前的定价,说实话还是比较高的,不过行业内目前就豆包的定价低的离奇,其他大模型定价都相对比较高;

三、商业模式思考

1. 未来可能通过什么模式实现商业化?

对于chatbot类产品的商业模式问题,参考之前我在豆包深度分析的文章里面提到的,个人觉得和豆包类似可能不会有太大的差异,不过在模式的选择上可能会有些侧重和差异,变现模式可能会更侧重订阅模式,广告模式可能不会是比较好的变现方式,和字节豆包不同的是,元宝的产品定位还是主打效率为主,所以可能不一定适合做广告;

2. 用户的核心付费动机和需求是什么?

  1. 为信息获取效率提升付费:信息的获取效率包括检索效率和阅读效率,未来元宝可以通过提供更深度的检索能力和垂直数据,为用户提供增值服务;而阅读效率方面,未来绝不是像现在的文档对话问答这种形式,而是更直接和产品化的形式,包括脑图、结构化文本等,提供更多的阅读效率提升的产品形态,从而从产品能力上打动用户付费;
  2. 为深度内容生产效率提升付费:生成效率中包括文本内容的生产和视觉内容的生产,未来元宝可以提供更多垂直领域的内容生产AI,通过优质的生成结果让用户愿意付费;
  3. 为工作流效率提升付费:工作流效率场景包括办公、教育等多个领域中,以任务拆分为主要形态的场景,包括AI数据分析、AI PPT等,通过工作流更好的解决大家在办公和学习、生活中的效率问题;

3. 成本结构

与豆包类的AI产品相似,元宝的其核心成本主要包括技术、人力、市场营销费用这几部分成本,至于具体的成本规模,尚不得而知;

  1. 技术成本:包括模型成本、服务器和带宽成本;
  2. 人力成本:包括研发人员、产品和运营人员的人力成本
  3. 市场费用:拉新获客的市场投放、市场营销的成本;

四、核心产品数据分析

1. 活跃规模数据表现

根据similarweb数据平台提供数据,腾讯元宝web端8月的访问用户数也就是MAU是108万,DAU将近4万左右;APP端数据根据Questmobile数据平台公开数据显示,腾讯元宝APP端8月的MAU是接近60万左右,DAU 将近7万

由此可见,如果只看web+APP的情况,腾讯元宝目前的月活水平也就是不到200万的水平,体量还不是非常高,跟豆包等平台的水平差距甚远,不过这也正常,目前产品还在持续打磨阶段,还没有大规模推广,相信以腾讯的流量能力,想扶持一个应用快速增长,或许也不是难事,但是关键还是要先把产品做好;

(以上数据参考similarweb)

(以上数据参考similarweb)

(以上数据参考QuestMobile)

2. 营销投放数据

以APPGrowing的数据为例,腾讯元宝从7月开启更大规模的投放,单月投放预算预计在1000万左右,从用户增长情况上看,8月的整体输入相比7月增长不大,预计7月主要是临时增加投放,8月份可能没有增加投放量;从投放渠道上看,目前主要还是以腾讯内部的流量为主,包括腾讯视频、微信、QQ、腾讯新闻等渠道;

(内容数据已做脱敏处理)

五、用户画像分析

对于腾讯元宝当下的用户画像分析,参考部分第三方数据平台数据,用户画像核心特征如下:

  1. 男性用户为主:男性用户占比将近76%,该数据表现个人认为和目前AI大盘用户特征比较相似,主要受大盘用户影响;
  2. 办公族和大学生为主要用户:从年龄的角度上看,88%的用户是年龄19~45岁之间的用户,为比较主流的互联网群体,从年龄上看,以办公族和大学生为核心用户;
  3. 更多用户来源于一二线城市:由于元宝目前的推广渠道主要通过社交媒体和视频内容等平台,加上营销投放规模目前不大,预计会优先锁定一二线城市人群,该部分人群对于AI资讯的敏感度会更高,从参考数据上看,元宝用户中一二线城市用户占比将近60%;

六、未来产品发展的思考

1. 从产品定位角度看

从产品目前的定位的角度上看,目前元宝重点聚焦效率场景,预测元宝未来核心会围绕着如下3个效率方向持续迭代产品:

信息获取效率:其中重点包括AI搜索效率、AI阅读效率;

  1. 对于搜索效率,参考目前行业的发展方向预计主要会包括支持更多垂直场景的检索,包括学术搜索、文库搜索等;从检索介质上看,可能会从网页和公众号内容检索,拓展到文档、视频等领域检索,发挥微信视频号内容等资源的优势;
  2. 对于阅读效率的提升,目前市面上的做法都差不多,主要包括语言转换(翻译)、信息结构化(脑图呈现)、概读和精读、语音或视频转文字等;

内容生产效率:包括文本、图像、视频等多模态内容生产;

  1. 文本内容生产:包括营销内容(小红书、知乎和公众号长文等)、知识内容(研报、文章),以及面向学生的论文、作业、作文等场景的内容生产效率场景;同时,在内容生产环节,元宝预计会和腾讯文档合作打通,解决文档编辑器相关的能力;
  2. 图像内容生产:包括营销素材、海报、头像等场景的内容生产,在图像编辑器里面或许和腾讯智影可以合作打通;
  3. 视频和音乐生产:当然,视频生成和音乐生成自然也会是一个探索方向,不过目前这块的技术成熟度可能还不够,模型侧在在领域暂时没有看到太多应用落地进展,预计优先级会低一些;

工作流效率:包括办公场景、协作沟通场景等,工作流效率提升的场景非常多,这里不一一枚举,列举几个个人认为比较高频的场景需求:

  1. 任务流:包括以日程为起点的会议预定、人员通知等任务流;
  2. 会议效率:以语音笔记、语音和视频内容转文本分析等为主的场景;
  3. 项目管理和进度跟踪;
  4. AI PPT、AI数据分析等:包括目前很多平台都在做的AI制作PPT和分析数据等办公领域

2. 从腾讯生态角度看

  1. 内部生态打通:元宝和微信生态体系的应用打通,包括微信公众号、视频号、小程序、企业微信等内部产品的打通和合作;
  2. 外部合作:联合多个行业和应用场景的应用合作,共同探索AI应用落地场景;

七、近期热点思考

上线品牌智能体专区

9月上线9个品牌智能体,联合其他外部应用上线品牌智能体,包括健康管家、什么值得买AI、同程旅行、马蜂窝攻略助手、起点小说、快递100、微盟营销写作、canva设计、BB电竞主播等;

1)元宝推出品牌智能体的背景、目的是什么?

  1. 提升元宝和元器的品牌、口碑和影响力:品牌智能体的推出,可能更多的是腾讯元器团队来牵头,腾讯元器需要有标杆或者明星智能体来提升产品的影响力和口碑,从目前发展的情况以及扣子的前车之鉴,光靠开发者自发的开发智能体,是很难打造明星和标杆智能体的,元器这边选择了和外部有影响力的品牌应用合作的方式打造明星智能体,这个角度上看,做这个事情,更多的是从品牌和影响力出发;
  2. 让智能体能够被真正的使用,发挥实用价值,获得更多的用户增长:相比扣子做了很多不瘟不火的智能体,元宝的产品和运营人员们可能会更加认为,只有结合用户使用场景的智能体才能被真正使用起来,所以和应用场景内的知名应用合作可能更加有利于实际应用,同时也有利于传播和用户增长;
  3. 元器的能力试验:让外部的开发者参与进来,检验元器的智能体开发能力;

2)为什么选择这些品牌?

从目前品牌的挑选原则上看,主要以生活(健康、购物、旅游、快递、阅读、娱乐)、创作(营销创作)为主;结合产品的定位,猜测未来可能会增加搜索、阅读、教育、办公等场景的品牌合作方。

OK,以上即为全文分析。

作者:三白有话说,公众号:三白有话说

本文由 @三白有话说 原创发布于人人都是产品经理。未经作者许可,禁止转载。

题图来自Unsplash,基于CC0协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 公众号的数据太强了,模型能力稍微差一些,但提供的内容来源与信息线索,帮助非常大

    来自江西 回复
    1. 赞同哈,索引的质量很好,发挥了很好的检索价值,同时可信度也比较高

      来自广东 回复