ChatGPT为自动驾驶指了条明路

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

开通会员

发布

科技新知

2023-03-03

0 评论 3041 浏览 3 收藏

B端产品经理需要进行售前演示、方案定制、合同签订等，而C端产品经理需要进行活动策划、内容运营、用户激励等

在人工智能领域，ChatGPT的出现在很大程度上影响了各行业的生态，甚至对不少行业来说，原有的商业模式可能可以借此机会实现重塑。那么在自动驾驶领域，ChatGPT的出现是否可以为其带来新的可能？一起来看看作者的解读和分析。

ChatGPT继续如同黑洞一般，吸引着各大势力布局。

外界看来，这是人工智能领域中的里程碑事件，代表着AI技术发展到临界点，也同样预示着原有的商业模式都有机会重塑一遍。

正如英伟达创始人黄仁勋所述，由于ChatGPT可以借助API方式被外界调用，意味着它可以接入各类软件，它的出现也将像浏览器改变互联网、苹果应用商店改变软件行业一样，对行业产生巨大的冲击。

典型的如搜索引擎、云计算行业，由于ChatGPT的横空出世，原有的市场竞争态势被打破。譬如百度可以借着文心一言，售卖其智能云服务。这对于场上原有的玩家而言，机遇与挑战同在。

那么汽车行业呢？可以看到，近段时间内，车企们也频频在ChatGPT领域发声：

先是，集度、长城、东风日产、爱驰、零跑、吉利汽车、海马汽车等近10家车企加入文心一言的朋友圈；紧接着，毫末智行宣布，自动驾驶认知大模型正式升级为DriveGPT，在自动驾驶模型算法方面，全面应用ChatGPT的模型和技术逻辑。

ChatGPT之于汽车行业，乃至于更聚焦的自动驾驶领域，到底是放卫星还是起飞点？

一、止于语音交互“鸡肋”？

集度是最早公开打出“ChatGPT上车”概念的车企。

2月14日，集度ROBOVERSE三里屯体验中心启动会上，CEO夏一平率先宣布，将融合百度“文心一言”的能力，打造针对智能汽车场景的人工智能交互体验，支持汽车实现自然交流的再进阶。

据了解，此次“文心一言”上车集度，是全球类ChatGPT技术首次应用于智能汽车产品。

对于合作的具体细节，现场并未公布。对此夏一平表示，“关于具体会有哪些功能，我只能说现在还在努力地去跟百度团队在对接，因为大家也知道文心一言将在三月份发布，之后才会去做我们的应用。”

不过，结合其他资料，可以大胆猜测出，ChatGPT大概率率先应用在语音交互方面。

毕竟，除了ChatGPT本身就是凭借其出色的交互能力出圈外，同一时期，长安汽车官方公号发布了题为《假如把ChatGPT装进长安深蓝SL03》的文章，让消费者自然而然联想到车载智能语音交互功能上。

现阶段，作为市场主流的交互方式，智能语音是智能座舱的标配功能。根据消费者调研数据，语音交互功能是座舱内体验比例和满意程度最高的交互方式。

一般而言，主机厂将语音交互功能作为其产品智能化与差异化的核心体现。比如，梅赛德斯-奔驰的用户体验团队为其车载语音体验的开发设定了三个目标：

允许司机像对待另一个人一样自然地交谈。
支持比典型语音服务更多的查询类型。
将语音更自然地集成到整体车内体验中，以便用户可以在语音和触摸控制之间无缝切换。

然而，现实往往很残酷。由于车企对语音交互技术的掌握有所欠缺，导致车载语音系统的交互程度普遍较弱，体验一般，大多时候沦为“鸡肋”。

个中缘由，其实在于智能语音交互技术上，仍然存在难点。

智能语音交互的技术逻辑主要包括三大部分：识别、理解和执行。目前提供解决方案的厂商中，识别部分已经趋于成熟，识别率可以达到90%。行业的痛点主要集中在“理解”部分，大部分的车载语音交互系统在“理解”上并不智能。

举个例子，此前传统主机厂提供的前端语音交互功能，大部分采用命令控制。用户需按照指定命令进行交互，机器不具备语义理解能力。交互机械化，导致整个系统功能单一、命令词单一。

那么，基于AI语言大模型，对任何领域的任何问题几乎都能进行整合回答的ChatGPT，能否给车载语音交互系统带来新的可能？

答案是肯定的。“ChatGPT在推理和学习能力上优势明显，不仅可以用于理解和对话，更可以通过上下文交流和自我学习，来实现辅助创作和知识进化。这些能力同样适用车载语音交互领域，融合对话智能技术、深度学习大模型技术、工程化能力、大数据的潜力，带来更流畅、更有效的响应……”思必驰汽车事业部产品总监葛付江如此认为。

从这点来看，如果汽车智能语音能够植入类ChatGPT技术，在高用户黏性之下，未来的商业化前景将更加广阔。

当然，考虑到成本层面，又往往会将相关厂商拉回冰冷的现实。

根据Lambda官网数据，微软为OpenAI设计了一个包含10000块Nvidia V100 GPU的分布式集群进行GPT-3的模型训练，由于模型参数量较大（共1750亿参数），训练完成共耗费30天，消耗总算力为 3640PF-days。以Nvidia Tesla V100的 Lambda GPU实例定价为1.50 美元/小时测算，GPT-3的完整训练成本将达到466万美元/次。

二、自动驾驶的“突现”时刻

可以看出，ChatGPT短期内更多是在智能化方面，赋能汽车行业发展，离完全意义上的自动驾驶还是有些距离。对此，ChatGPT自身也给出了如下回答：

作为一个语言模型，ChatGPT主要用于生成自然语言文本，如对话或文章等。自动驾驶技术需要处理的是感知、决策和控制等方面的问题，这些问题与ChatGPT所处理的文本生成任务并不相关。因此，在技术上，将自动驾驶技术与ChatGPT蹭热点并不可行。但是，自动驾驶公司可以利用ChatGPT等自然语言处理技术来提高其产品的人机交互能力，以更好地满足用户需求。

实际上，这也是业内主流的观点。此前，中国电动汽车百人会论坛（2023）专家媒体沟通会上，副理事长欧阳明高院士表示，ChatGPT出来之后会引发人工智能新一轮的革命，对智能驾驶也会产生深远的影响。

“马斯克做的就是基于这条技术路线，就是所谓的大模型、大数据、大算力……为了获得大数据，必须要大量卖智能辅助驾驶电动汽车，尤其是城市辅助驾驶今年可能大家会争先恐后地上市，这也是很重要的技术趋势。”

如何理解这段话？需要知晓的是，如果细究的话，ChatGPT成型背后有一个十分重要的基本原理能力—“突现能力（Emergent Ability）”，一般定义为“当系统中的量变导致其行为发生质变时出现的现象”。