爆火的ChatGPT，先颠覆谁？

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

开通会员

发布

北冥乘海生

2022-12-11

2 评论 9156 浏览 6 收藏

产品经理的不可取代的价值是能够准确发现和满足用户需求，把需求转化为产品，并协调资源推动产品落地，创造商业价值。

新上线的ChatGPT迅速成为了现象级的AI应用。它代表了AI技术怎样的飞跃进步？它的出现又将颠覆现有的哪些应用？本文以ChatGPT实际使用案例详细分析了这款应用的技术路线，以及它在信息搜索可能引发的颠覆性影响。希望能给你带来启发。

这两天，新上线的ChatGPT实在是太火了！首富马斯克一马当先，带着大家玩得不亦乐乎，看起来，人工智能的奇点就要到来了！没玩过的朋友，我也不多作介绍了，自行搜索即可。

爆火的ChatGPT，先颠覆谁？

作为一名二手人工智能从业者，好多人催我写写，人类是不是悬了？当然，人家源代码我没地看去，看了没人给讲也是一头雾水，外面那些信息，我看也半真半假。

所以，咱们也不讲什么技术框架，就从实际的使用案例来看看，这款现象级的AI应用，采用的是什么样的技术路线，能颠覆现有的哪些应用。

篇幅有限，今天只聊以下几个问题：

这次的ChatGPT，为啥一下子这么猛？
这家伙准备先颠覆谁，是搜索引擎么？
AI关底的图灵测试，马上要被KO了么？

一、ChatGPT这次为啥这么猛？

与其前一代相比，ChatGPT的效果太惊艳了！大家体会最深的一点，是机器人说的“像人话”了。这个像人话，有两层意思，首先是对一些知识性内容的回答准确率大大提升，这个例子就太多了，咱们随便贴两条：

爆火的ChatGPT，先颠覆谁？

您看这专业程度，至少比问我靠谱！它反映了什么技术进展呢？

自然语言处理的大模型，一直有个问题：如果完全无监督训练，无法甄别语料的真假和质量；这次ChatGPT从回答质量上有质变，应该是对某些高质量内容做了加权，采用了类似有监督训练的方法。从结果上来看，是相当成功的。

最让我感到惊讶的，是ChatGPT这次在伦理方面给出了诸多令人称赞的限制，不用说，这肯定也得有点监督。除了大家熟悉的“未来预测类问题不作答”以外，下面这两个例子的对比，也相当出彩：

爆火的ChatGPT，先颠覆谁？

除了内容，ChatGPT回答的条理性和语言流畅度也特别好。基本上会把各方面的信息综合成一二三点的模板，颇有点领导讲话的派头。因此，我认为在语言生成的结构上，也应该是特意选择了一些高质量的严肃帖子，同样采用某种程度的有监督学习。

所以您也能看出来，它说话老是脖子冲南脸冲北的老干体，一点儿也不像在论坛里混出来的语言风格。

后来有消息说，ChatGPT这回采用了强化学习的方案，而强化的具体做法，就是找几个人盯着结果标注，这本质上跟有监督意思也差不多。

二、ChatGPT将首先颠覆谁？

那么，ChatGPT是不是能够如很多人所期盼的那样，成为搜索引擎的杀手呢？

熟悉搜索的朋友应该了解，搜索查询分为两类：信息型搜索（Informational search）和浏览型搜索（Navigational search），咱们分别来看看。

信息型搜索，就是要找某个具体的信息或知识，要求当然就是准确、清晰。从清晰性来说，ChatGPT给的这种结构性呈现，比传统搜索引擎强多了！可是从准确性来说，坦率地说，目前还差点儿，经常会有些似是而非回答，关键是——人家还倍儿自信：

爆火的ChatGPT，先颠覆谁？

特别是中间那个，给我气乐了：要这么找富婆，恐怕活不过正月十五！

再来说说浏览型搜索，说白了就是用户给个关键词用搜搜引擎帮忙逛街呢，这时候不要求信息每条都准确，但是全面性和实时性很重要。

拿实时性来说，这个模型目前还是做不到准实时更新的，并且可能因为训练成本相当高，目前其信息的横截面，应该还停留在去年的《纽约时报》。

从语言相关的信息覆盖度来看，ChatGPT说只有英文语料，中文的问答都是通过机器翻译转换成英文进行的。这一点也通过实测得到了验证，如果要用到只有中文语料中才有的背景知识，它基本上回答得是驴唇不对马嘴的：

爆火的ChatGPT，先颠覆谁？

所以，总结一下：我认为ChatGPT对于搜索引擎来说，肯定算是一个重要对手了。只不过，由于用单条回答替代了信息罗列，对准确性的挑战相当大，目前还是任重道远；另外，现有的技术栈看起来还不能支持准实时的信息索引，这对其实用性限制非常大。

（顺便说一下，关于秦明夜走瓦砾场的事儿，普遍认为是被宋江所害，然而金圣叹认为，是花荣出的主意。）

然而，目前的ChatGPT，替代百科、Stackoverflow这种非实时专业信息社区，前景十分光明。这不，Stackoverflow应该已经感到了寒意，开始禁止上传ChatGPT生成的内容了。

爆火的ChatGPT，先颠覆谁？

当然，对那些情绪性、非专业性的图文社交网络，比如微博、Twitter，这么个说话人五人六、又不知疲倦的机器人，很可能给整个社区内容生态带来巨变，那就不是颠覆了，有可能直接就给干挺了！

三、图灵测试要被通关了么？

最后，再说说图灵测试的事儿。

ChatGPT一出，有群众惊呼：图灵测试要被终结了！我的看法是，这恐怕还是大大言过其实了。

图灵测试的标准，其实远超普通人的想象。要想让计算机聊一会不露馅儿，关键并不在于写代码、问攻略这些专业问题，而在于人类看起来非常浅近的一些日常聊天。

会聊的人，聊一两句对方就现原形了。比方说，我问ChatGPT的这两个问题，您看看它怎么回答的：

爆火的ChatGPT，先颠覆谁？

前一个问题，正常的人类回答多半是：“你为啥会关心1.25亿这个奇怪的数啊？”

后一个问题，正常的人类回答应该是：“这事儿哪能提醒领导，多尴尬呀！”

看到这两个问题的回答，我知道，虽然ChatGPT在理解和表达上已经取得了长足的进步，但是一些核心的困难点还是如常，并不容易解决。

当然，也没必要要求人工智能一定要通过图灵测试，即使通过不了，它潜在的商业应用场景也很多了。只是，客观地说，在目前的技术栈和方法体系下，通过图灵测试，短期内我认为还看不见希望。

毫无疑问，ChatGPT是人机自然语言交互的一个重要里程碑，并且已经具备了在非实时、专业性知识领域替代原有社区和垂直搜索的巨大潜力。

当然，客观地说，就目前的状态而言，如果说它就能替代搜索引擎，甚至通过图灵测试，那无疑是过于乐观了。

大家不要误会，我可并不是唱衰ChatGPT！恰恰相反，我觉得这玩意应该早点商用，随着大量用户反馈的累积，质量的提高很可能一日千里，适用的场景也越来越多。只是，就像咱们一开始分析的，如果在大规模的用户反馈中甄别高质量语料，实行有监督的模型进化，可能还真是个挑战！

当然，作为一个老码畜，看到ChatGPT写的哪些程序，我是为很多码农朋友的未来捏一把汗的。怎么样，你的后脊梁发凉了吗？

作者：北冥乘海生，公众号：计算广告（ID：Comp_Ad）

本文原创发布于人人都是产品经理。未经许可，禁止转载

题图来自 Unsplash，基于 CC0 协议

该文观点仅代表作者本人，人人都是产品经理平台仅提供信息存储空间服务

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

浅谈ChatGPT文章被收录于该专栏

共 13 篇文章18978 人已学习

北冥乘海生

资深互联网人~！大家多多交流。

28篇作品 298414总阅读量

02-215258 浏览

01-228099 浏览

刚刚

02-012787 浏览

02-092949 浏览

重启天涯直播：最高观看不到1000人，情怀难抵现实，关键是重启后怎么办？

05-303377 浏览

蓝狐

最后就有俩问题问得好，一旦涉及到人类那种敏感情绪才能回答的内容，机器就不行了，说白了，现在只是从被动搜索变成了主动搜索，还是冰冷的现成答案，我个人观点，无法通过图灵测试

最近来自浙江回复
1. Me丿二十一樂回复蓝狐
  
  也可能文化差异导致的
  
  最近来自天津回复

开发转产品的成功之路：我给你的3个建议

专题

16139人已学习13篇文章

如何做产品可行性分析？

在产品工作中，产品的可行性分析就太重要了，这是产品从想法到实施必须经历的。本专题的文章分享了如何做产品可行性分析。

专题

13456人已学习13篇文章

如何构建增长模型

增长模型是产品增长的通用思维框架。本专题的文章分享了如何构建增长模型。

专题

12876人已学习14篇文章

交互规范指南

良好的交互规范可以很好的帮助企业、团队提高产出，保证用户体验。本专题的文章分享了交互规范指南。

在线教育的现状、趋势和未来。

虽然大厂们纷纷奔赴Web3.0，但是不少人还是对这个概念及相应生态一知半解。本专题的文章分享了对于web3的看法。

专题

17115人已学习14篇文章

什么是RFM模型？如何应用RFM模型？

RFM模型是与用户价值相关的常见模型之一。本专题的文章分享了什么是RFM模型？如何应用RFM模型？

网站统计