国内大语言模型产品的7个问题-六小龙or六条虫?

1 评论 948 浏览 2 收藏 12 分钟

在AI领域,被誉为“六小龙”的六家初创公司正面临着多重挑战。从寻找新的创新源泉,到解决内容幻觉、知识融合难题,再到价值观的重塑和产品方向的探索,这些公司正处于一个充满机遇与挑战的阶段。本文将深入探讨这些问题,并展望AI技术的未来发展趋势,希望能为读者提供一些有价值的思考和启示。

目前零一万物、百川智能、智谱AI、月之暗面、Minimax和阶跃星辰被称为X小龙。

另外在国内大模型公司中,一直有着“X小龙”的说法,有说四小龙的,也有说六小龙的,还有说六小虎的。

目前的AI六小龙主要指的是在AI领域表现突出的六家初创公司,包括零一万物、MiniMax、百川智能、智谱AI、阶跃星辰、月之暗面

问题一 迷茫:无师可偷

之前2022年年底从GPT-3.5开始,大家开始是筛选掉第一批调用GPTAPI接口封装为自家模型并号称大模型的公司。

到GPT-4开始筛选掉一批基于LLAMA等开源模型做调优的并号称大模型的公司。

到GPT-4o发布至今半年多过去了,偷感十足的大模型公司在等着GPT-5的发布,GPT-5产品迟迟不再发布,导致无师可偷。

六小虎也好,六小龙也好至少是有部署过预训练的,可能内核必然借鉴了Transformer的架构和数据输入和生成方式,但是六小龙是国内除了BAT之外不仅做了调优API调用,还是做了预训练的,预训练的成本大家都懂:巨贵。

问题二 错位:内容幻觉

六小龙大模型虽然在写作、推理、规划、数学、代码等诸多领域都展现出了强大甚至比肩人类的能力,却经常出现内容幻觉、价值观错位、歧视偏见等问题。

我怀疑或者说可以肯定六小龙的大模型产品没有研究过大模型内部语言和知识机理。对他们来说大模型仍然是一个黑箱。

一评测的时候貌似得分都很高,其实评测数据是从外部行为评估大模型的能力,容易受到数据选择、指标设计、提示方案等因素的影响。

对六小龙的产品团队来说大规模参数化表征以及核心过程(如预训练、指令微调、人 类反馈强化学习)的复杂动态特性仍然是个谜。

问题三: 复杂:知识融合

大模型难以理解复杂的知识结构,如实体、关系、事件和概念以及其间的复杂关系;同样的知识可以通过不同语言形式表达,大模型也难以处理。在知识不完整性方 面,大模型要能够利用外部资源,并与内部参数化知识进行整合。

这就需要对大模型获取外部资源、 利用自身大模型中知识以及处理语言模型内知识与外部知识冲突能力进行系统评测。目前评测表明, 大模型在外部知识获取、利用和内外部冲突知识处理方面存在挑战。

大模型在知识数据存储、调用、融合,在知识结构的多源性、知识对齐上有太多的时间需要产品补充上。

问题四:三观:价值重塑

大语言模型不是传统的搜索引擎,以前的搜索引擎是根据提问,搜索出来一系列经过排序的网页,不会想大模型给予直接的结果,在大模型时候,假如不加思索的采用生成的内容,很可能出现三观不正确的问题。

问题五:涌现:远离AGI

用户从一开始对大模型的期待是AGI,产生智能涌现。可以完成过去需要不同专用小模型才能完成的多种任务,呈现出与人类通用智能相似的功能。

目前六小龙普遍没有这类产品出现过。

国际上有些团队在这一领域探索稍微提前一些,例如, 斯坦福大学团队 2023 年 4 月推出一个虚拟小镇,构建了 25 个大模型驱动的智能体,拥有不同个性的智能体,在小镇中自由生活、工作和社交; 从而研发出大模型的自然语言交互能力使之发生在机器和机器之间,作为信息交流的工具和重要载体。

问题六:分裂:理强文弱

目前六小龙的团队核心以算法工程技术人员为主,不懂计算机技术的人在团队比较难混,例如:不懂K8S在基础数据输入层可能就难以作为主程核心,不懂Transformer架构,层,在模型架构阶段可能会被避之门外。

实际上对用户来说用户输入中文生成的图就是没有输入英文来的准确,请问六小龙你们为啥?

其中有一个非常重要的原因我分析是:中文语料数据集比较少,导致大模型训练样本质量不够高、规模不够大 。

构建更高质量,更大规模的中文语言资源库,需要发挥文科特别是语言学科的优势。

问题七:产品:不动脑子

先看一下六小龙的产品如下图:

1、万知,零一万物

假如不说是零一万物的产品,可能很多朋友不知道有这个大模型产品。假如零一万物不是李开复老师的大模型,可能会被骂的很差。打开万知网站,我也不知道为何要用万只?万只的产品能否告诉我这个产品有什么特长和差异化?

2、百小应,百川智能

百小应选的赛道是热门赛道,搜索,但是这个产品得等百川智能突破以上7个问题,才能是一个好的产品。

目前的百小应,应用主要问题解决传统搜索问题还没解决,产品去引导要下载APP了,有点急了。

3、智谱AI,智谱清言

智谱清言看着框架结构跟ChatGPT产品像。当你用了以后,你会认可日久见模心,该用谁,谁好用自见分享,建议大家比较一下,大家愿意比较即是压力也应该是产品团队的动力。

4、kimi 月之暗面

这款产品自从营销之后模型就貌似停止进步了,在其宣传超长上下文,创始人是否套现风波之前,我每次阿里巴巴邀请给淘宝教育讲课的时候,我会介绍一下这款产品,当时ChatGPT读数据一是不合规,二是调用也很贵,所以用Kimi帮助阅读PDF提炼摘要还挺方便的,请问kimi产品这一年了kimi产品又有哪些进步?

5、MiniMax

MiniMax海螺的产品团队可能末尾淘汰制,目前能看到海螺的产品团队求生欲比较强,再积极的迭代。

产品整合了音乐生成、视频生成、文生文、再突破需要产品有创新的应用了。

6、跃问:阶跃星辰

这款产品写文章的时候第一次用,先不点评,大家自行比较

从PC互联网到移动互联网再到AIGC,我做过的产品不下数十款,正是对这些产品的全情投入,形成了产品感,就像现在流行的偷感,很刺激当你形成产品感,你大概率能够感知一款产品的未来会如何。

早些年PC时代你能够通过一款产品得前端就能看到这家公司的组织结构,例如2019年你看天猫,上面的母婴模块,女装模块,箱包模块,其实其产品就是对应其组织团队的划分的,组织团队进而也决定其产品得价值。

后面到移动互联网,字节跳动、美团、大家能够看到前者给用户提供了完美的上瘾模型,后者给用户解决点外卖的痛点。

到移动互联网至少产品经理还在干人事,还在思考用户需求,用户的痛点是什么,如何设计产品去解决这些痛点。

可能AIGC前半程产品经理忘记了这些,也可能本来还不够专业,相信下半场AIGC无论是大模型基础模型产品还是业务应用型大模型产品,将会快速的回归用户、回归客户的本质。

本文不是将六小龙说成六跳虫,意在一起去找到AIGC的产品价值、用户价值、市场客户价值。

专栏作家

连诗路AI产品,公众号:连诗路AI产品。人人都是产品经理专栏作家,《产品进化论:AI+时代产品经理的思维方法》一书作者,前阿里产品专家,希望与创业者多多交流。

本文原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自Unsplash,基于CC0协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 不得不说AI极大可能就是下一个风口,尽管只是起步就已经展现了其强大的能力。

    来自广东 回复