大模型混战，谁将成就AI时代的“新地基”？

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

大模型混战，谁将成就AI时代的“新地基”？

新识研究所

2023-04-15

0 评论 6850 浏览 3 收藏

19 分钟

随着ChatGPT的破圈，掀起了一场AIGC浪潮，国内外纷纷开始布局，发布自己的大模型。那么，在这匆匆发布的背后，是真的技术成熟，还是鱼龙混杂？各个大模型的实力又是怎样？本文将从语言大模型、算力与技术底座与具体应用层面状况三大角度，分析各大模型。

自2022年stable diffusion模型的进步推动AIGC的快速发展后，年底，ChatGPT以“破圈者”的姿态，快速“吸粉”亿万，在全球范围内掀起了一股AI浪潮，也促使了众多海外巨头竞相发布属于自己的大模型。

而在国内，实际上很久之前，阿里、华为、腾讯等公司便早已有所布局：2019年，阿里开始布局大模型研发，去年9月发布“通义”大模型系列的众多大模型；华为在2021年基于昇腾AI与鹏城实验室联合发布了鹏程盘古大模型；而腾讯的思路也与阿里相似，发布了混元AI大模型；第二梯队的京东、网易、360、字节跳动等企业，也纷纷官宣了自己在AI大模型方面的布局。

而进入2023年以来，随着文心一言的发布，成为了中国第一个类ChatGPT产品后，各家的大模型也纷纷亮相，一时间，国内仿佛陷入了“大模型之战”中。

截至目前，百度文心大模型、华为盘古大模型、商汤大模型、阿里大模型都已亮相，而后还有许多大模型正在准备粉墨登场。

那么，在这匆匆发布的背后，是真的技术成熟，还是鱼龙混杂？各个大模型的实力又是怎样？

本文将从语言大模型、算力与技术底座与具体应用层面状况三大角度，来分析和研究目前已经发布的大模型的技术基础、应用场景和用户生态，看看哪些大模型更有可能在这混战中成功突围。

一、ChatGPT不该止于C端

ChatGPT，作为最早出圈的大模型产品应用，其问答的流畅程度与准确程度，可以很好地体现NLP模型的水平。而目前，国内厂商百度、阿里也都发布了类似模型，那么，相比之下，文心一言与通义千问的表现如何？

首先是最近对话式AI们经常出现的一个典型问题，面对自己知识库中没有，或本身就是错误的提问时，仍能对着错误描述侃侃而谈，简称一本正经的胡说八道。

于是，我先问了通义千问这样一个问题：你知道唐僧为什么要上梁山吗？

通义千问在思考后，给出了这样的回答：它首先简单对唐僧进行了介绍，然后将其带入了《水浒传》中宋江的角色，但最后却又回到了《西游记》中，还讲“这一情节体现了唐僧的坚定和决心，也反映了他作为一个有信仰的人物的形象。”

而同样的问题给了文心一言，却得到了一个更加简短但同样荒谬的答案：唐僧上梁山的原因是因为他被迫出走，被唐朝通缉，无路可走，只能上梁山。

本次测试中，通义千问与文心一言都犯了同样的错误，不过，在我指正之后，通义千问也进行了积极地认错，展现出了良好的连续问答能力，而文心一言则并没有“听懂”我的指正。接下来，我又问了它们一个经典的数学问题——鸡兔同笼，“鸡兔同笼，头共10，足共28，鸡兔各几只？”

通义千问在得到提问后，快速做出了回答，为我列出了计算该问题所需要的方程式，还贴心地在后面备注上了方程式的由来。

而文心一言就显得更加直接，回答了我的问题。

而在这两个问题之外，我还让它们两个一起编写了代码、赏析了诗词、撰写了文章。总的来说，在面对用户提出的问题时，通义千问与文心一言在绝大多数情况都可以给出较为正确的回答，在面对C端用户的提问时，两个产品显示出了不相上下的实力。

而在C端的势均力敌之下，阿里却祭出了同类竞品难以比拟的B端服务能力。

通义千问在C端用户之外，专门针对企业用户发出了邀请共测，企业可基于通义千问打造专属大模型，在企业专属的大模型空间中，既可以调动通义千问的全部能力，也可以结合企业自己的行业知识和应用场景，训练自己的企业大模型。

具体而言，除了通用场景之外，企业由于业务特性的不同，对于大模型服务有特殊需求和要求，希望让通用的大模型变成企业专属的大模型，支撑企业各式各样的应用与服务。

阿里云希望通过产品化的方式，满足企业专属大模型从生成到部署全生命周期的需求。

在发布会当天，阿里云就宣布将与OPPO安第斯智能云联合打造OPPO大模型基础设施，基于通义千问完成大模型的持续学习、精调及前端提示工程，未来建设服务于其海量终端用户的AI服务。同时，中兴通讯、吉利汽车、智己汽车、奇瑞新能源、毫末智行、太古可口可乐、波司登、掌阅科技等多家企业也表示，将与阿里云在大模型相关场景展开技术合作的探索和共创。

或许，在竞争激烈的C端之外，面向企业端的大模型构建能力，才是通义千问真正的优势所在。

而相关专家也在交流中表示，通义千问将会在企业各自深耕的领域中为他们提供构建大模型方面的帮助，带来更好的生态系统与商业模式。

二、大模型背后的算力之争，谁占先机？

纵观国内发布的大模型，可以发现，相对于国外尖端的AI企业来说，国内还像是蹒跚学步的孩童，在这条道路上刚刚起步。而在大模型发展的道路上，最重要的实际上还是最基础的算力资源的多少与怎样利用算力的能力，那么国内顶尖大模型企业在算力上的储备几何？

首先是近日同样发布了大模型的商汤科技，在前段时间的交流中，商汤科技内部的相关专家对公司的算力情况进行了交流。

国内能拿到最尖端的显卡是来自英伟达的A100 GPU，商汤科技在美国对华禁售之前，便提前囤积了上万张A100芯片，是国内算力资源比较充足的厂商。

除了来自英伟达的显卡之外，商汤还在采购国内的GPU，并且专家表示，早在去年以前，就已经在大装置中适配了许多寒武纪与海光信息的GPU卡，但在当下商汤仍旧面临着如何将国产GPU卡进行大模型训练适配的问题。

在商汤之外，华为的盘古大模型也引起了众人瞩目，但在算力资源方面，华为却略显窘迫。

因为受到美国的长期制裁，华为只得使用全部国产的加速芯片，而目前昇腾系列最先进大幅使用的型号昇腾910，也只有A100 70%的性能，从长期来看，将会制约大模型的发展。

而算力的短缺也直接影响了华为的发展策略，选择性地放弃了C端的发展，主攻B端工业大模型应用。

而说起算力资源储备最多的企业，莫过于云时代中独占鳌头的阿里。

但从阿里云上的角度来看，当前云上至少拥有上万片的A100 GPU，从整体来说，阿里云的算力资源至少能够达到10万片以上。如果继续抬眼，从整个集团的算力资源来说，将会是阿里云5倍的这样的一个量级。

而在英伟达的芯片之外，阿里云也拥有众多国产化的GPU芯片，而最近的项目中，便选择了寒武纪MLU370，其性能基本过关(A100的60-70%)，检测合格，厂商态度积极，愿意与阿里对接，并且已经用在了CV等小模型的训练和推理上。

在2023年，阿里云算力资源的增速也将达到30%-50%。

得益于云时代的绝对领先，让阿里拥有了远超其他企业的算力资源，也让其在AI时代里天生就占得了上风。

但是，动辄超千亿参数的大模型研发，并不能靠简单堆积GPU就能实现，这是囊括了底层算力、网络、存储、大数据、AI框架、AI模型等复杂技术的系统性工程，需要AI-云计算的全栈技术能力。

而阿里是全球少数在这几个领域都有深度布局、长久积累的科技公司之一，也是为数不多拥有超万亿参数大模型研发经验的机构。

在AI算法方面，阿里达摩院是国内最早启动大模型研究的机构之一，2019年便开始投入大模型研发，在中文大模型领域一直处于引领地位，2021年阿里先后发布国内首个超百亿参数的多模态大模型及语言大模型，此后还训练实现了全球首个10万亿参数AI模型。

在智能算力方面，阿里建成了国内最大规模的智算中心“飞天智算平台”，千卡并行效率达90%，自研网络架构可对万卡规模的AI集群提供无拥塞、高性能的集群通讯能力。基于飞天智算的阿里云深度学习平台PAI，可将计算资源利用率提高3倍以上，AI训练效率提升11倍，推理效率提升6倍，覆盖全链路AI开发工具与大数据服务，深度支持了通义大模型的研发。

阿里云全栈AI技术体系，更是从机器学习平台、大模型即服务、产业智能三个层面，不断丰富AI服务，并通过全栈技术驱动千行百业的AI发展与应用。