车企也要搞大模型，但他们基本还在第一层 | 人人都是产品经理

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

{{ userInfo.member ? '查看权益' : '开通会员' }}

发布

注册 | 登录

车企也要搞大模型，但他们基本还在第一层

差评

2023-11-22

0 评论 1974 浏览 3 收藏

10 分钟

车企也开始学起互联网企业搞起大模型了，而大多数车企目前只规划了座舱的语音功能，部分车企则开始结合大模型做智驾系统。具体如何解读当下车企投入大模型的发展现状？一起来看看本文的分析。

最近这段时间，车企们也开始学互联网企业，玩起大模型了。

比如理想的自研大模型 Mind GPT ，广汽的 AI 大模型平台，以及吉利的全栈自研全场景 AI 大模型等等。

甚至自己做不了的，也得找人去合作。像是东风日产、红旗、长城这些，就宣布接入百度的 “ 文心一言 ”。

不过，这些车企们到底是纯纯搞营销还是真的有东西，脖子哥还得仔细看看。

就目前而言，大多数车企还只规划了座舱的语音功能，说白了，就是做 ChatGPT 的语音版。

用上的话，语音助手确实会比以往更聪明一点。

比如百度的文心一言，据说搭载上车之后，可以一边在车上电话开会，一边自动记录会议纪要，并且完成简单的 PPT 制作。

那么……打工人就算开车也没理由不干活了，百度是懂加班的。

而吉利的这个全场景 AI 大模型就更有意思了，说是有主动搭讪、自动唱歌以及哄娃等能力。

但，用车机语音搭讪和自我营销，真的有人会用这个功能吗？他的精神状态真的还好吗……

相比他们，一些车企已经到了第二层，开始用大模型做智驾了。

这里面可就大有说法了。目前比较普遍的做法，是将大模型作为工具，辅助汽车的智驾训练，其中关键是训练智驾系统的应变能力。

目前智驾系统还不能保障 100% 的自动驾驶安全性，是因为存在 AI 还没见过的场景，一旦遇到这种情况， AI 就容易 “ 把 CPU 给干烧了 ” ，大多数自动驾驶的安全事故都是这样发生的，这个情况被称作 Corner case 。

为了解决一个 Corner case ，必须得经历数据预处理、数据标注、模型训练和模型仿真等过程，需要用上万的样本数据以及数周时间进行测试，费时费力。

过去用来训练 AI 的数据基本来自真实数据，但是由于 Corner case 发生的概率非常低，要找到世界各地出现的相同 Corner case 并不容易。

用上大模型之后，AI 就可以帮助构建虚拟空间，自动生成训练场景，可以大幅缩减成本。

比如华为的盘古大模型，会根据路采数据进行重建，生成可编辑的虚拟空间，将原来两周左右的 Corner case 处理过程缩减到两天内。

但这还不够，另一些车企选择了更为激进的做法，直接选择用大模型开干智驾。

这就不得不提到特斯拉的 FSD 。

早在 2021 年，特斯拉就采用了 BEV （鸟瞰图）+ Transformer 的智驾算法，可以说是在车企里用大模型做智驾最早的一批。

咱先不说这套智驾系统的原理是啥，先看这个 Transformer ，其实指的就是大模型架构， ChatGPT 就是基于这个架构生成的。

Transformer 模型架构和传统神经网络的区别在于，加入了 “ 注意力机制 ” ，举个例子，咱们在读一句话的时候，有些字很关键，有些字不关键，只要看这些关键字，就容易 get 到整个句子的含义，即使个别字写反，也不影响最终理解的结果。

因此 Transformer 就会对一句话中的每个字设置权重，最后对全文的理解根据每个字加权平均算得，准确性就相对更高了。

这套模型架构将主要用于 FSD 的纯视觉感知算法，帮助系统将 2D 的摄像头视频数据融合转化成 3D 的鸟瞰图，从而自行判断合理的行驶路线。

然而，就算这套大模型智驾方案拥有更高的泛化能力（举一反三的能力），特斯拉的 FSD 还是会遇到了各种 Corner case 。

比如在今年的 8 月 26 日，马斯克在直播测试自动驾驶时，AI 把左转车道的绿灯当成前进的绿灯，打算笔直穿过路口，此时的老马不得不主动介入刹停，才避免酿成事故。

要知道这可是当众直播啊！先不说观众对 FSD 系统的质疑，就算评论问起应如何解决故障时，老马也只能说 “ 将投喂更多样本数据 ” 。

因为压根没有什么直接了当的解决办法，毕竟模型是一个黑箱，没有人能在里面微操，除了继续训练还真没有什么别的办法了。

所以，大模型做智驾的主要问题，依然是处理不完的各种 Corner case ，未来的智驾大模型还得继续在泛化能力上进行升级。

不仅如此，大模型做智驾的另一个难处就是钱。

特斯拉之所以能用上 Transformer ，关键是有 72 TOPS 算力的 HW3.0 芯片作为支撑。而现在一些车企用的都是英伟达orin 芯片，它的算力更是达到 254 TOPS，今后随着模型越来越大，对智驾芯片的算力要求也会越来越高，这意味着车主就要为智驾掏更多的钱。

在研发方面，之前一些企业训练大模型用的都是 GPU 芯片，但现在都开始用上 TPU 了，功能越强的大模型研发难度越大，普通车企恐怕很难保持长时间的自研过程，与互联网巨头合作说不定会更加现实。

不过特斯拉在这上面算是铁了心，最近， FSD 又进行了一次全面的算法更新，打造了一个 “ 端到端 ” 的智驾模型，把整个智驾过程融入到一个算法和模型里面，这可能是未来各大车企做智驾大模型的一个方向。

要知道，过去的智驾算法是分成三个部分的，感知、决策和执行各司其职，如果将其整合在一起，那么成本会更低，智驾反应也会更快。

随着技术一次次迭代，也真说不好，什么时候就能把智驾大模型最后的安全难关给攻破了。

但在此之前，一定是一段非常艰难且痛苦的过程。

要脖子哥说， “ 大模型上车 ” 这玩意儿确实有用，但能发挥出几分功力，还得看各家车企的实力了吧。

图片资料来源：

从乘用车到商用车，不搞大模型的车企不是好车企？
华为、特斯拉带头，车企卷入「大模型」军备竞赛
AIGC｜万字长文！带你了解AI大模型技术演进
自动驾驶攻入大模型

作者：TC，编辑：脖子右拧 & 面线

来源公众号：差评（ID：chaping321），Debug the World。

本文由人人都是产品经理合作媒体 @差评授权发布，未经许可，禁止转载。

题图来自 Unsplash，基于 CC0 协议。

该文观点仅代表作者本人，人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

差评

Debug the World

95篇作品 338450总阅读量

经济下行第一剑，互联网巨头先“斩”曲库

03-291750 浏览

经济下行第一剑，互联网巨头先“斩”曲库

亚马逊工作方法探秘：创新利器 2 Pizza Team

03-228044 浏览

亚马逊工作方法探秘：创新利器 2 Pizza Team

谁会用抖音桌面端聊天软件？

01-055417 浏览

谁会用抖音桌面端聊天软件？

拿捏品类“氛围感”，让品牌名第一时间与顾客共情

09-112736 浏览

拿捏品类“氛围感”，让品牌名第一时间与顾客共情

Character.ai：每个人都可定制自己的个性化AI

04-1618853 浏览

Character.ai：每个人都可定制自己的个性化AI

评论

目前还没评论，等你发挥！