智能座舱之语音TTS | 人人都是产品经理

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

注册 | 登录

智能座舱之语音TTS

2023-10-08

1 评论 3454 浏览 10 收藏

B端产品需要更多地依赖销售团队和渠道合作来推广产品，而C端产品需要更多地利用网络营销和口碑传播来推广产品..

目前在车载场景中，TTS技术的应用已经十分常见，那么，想在车载领域、智能座舱领域深耕的产品同学，你是否对车载TTS有所了解呢？不妨来看看这篇文章的内容分享。

一、TTS是什么

文字转语音，大家可以以微信的语音转文字的反向工程来理解，主要作用是实现机械对话。

二、车载领域语音合成现状分析

车载场景目前是TTS技术的重要应用场景，其发展主要经历了以下四个阶段：

其中，高度个性化的发展应该细分为两个阶段。

第一个阶段，基于人群圈层的个性化，划分的圈层可能为男性/女性，儿童/成人/老年人，车主/乘客，基于车企的策略不同。

B 端产品经理如何快速成长？

产品与业务架构主要是将整个业务工作流进行分层，梳理，然后抽象出一个个需求，将业务需求与产品合情合理的映射起来，最终使业务数据在产品中流动，执行，记录，使用。

第二个阶段，通过声纹识别或摄像头等感知手段，实现真正的千人千面，定制自己专属的TTS风格化回复。

三、当前车载场景下的痛点

机械感：听感上仍能够识别出是机械的合成音，不自然、重读不准确等；
风格单一：语音合成风格较为单一，并且多为播音风格，缺少乐趣；
情感欠缺：播报的情感音，融合进车载的交互场景方式粗暴，体验不佳，具体表现为不同情感音不区分场景、不区分文本，仅仅通过音调等变化表达情感，存在机械的僵硬感；
智能化：场景定义不全面或不准确，由于车载TTS的回复语基于车载语音产品经理对场景的定义，存在漏定义、定义错的情况；并且在通过TTS引导用户的角度看，当前所有的车企方案较少考虑到这一点。

四、车载TTS的重要指标

车载TTS的评价指标沿用语音业界的MOS评价方式，即邀请听音人试听合成语音，根据分值描述，从拟人性、连贯性、韵律感等方面为语音选择合适的分数，通常主要的指标为：

韵律准确度；
端云音色相似度；
发音准确度；
发音清晰度。

但是以上指标主要都是针对TTS发音的问题，在实际测试的过程中，也会对TTS反馈的语料准确性、是否合适等进行测试，通常单一问题单一解决。

五、语音TTS遇到的典型问题

端云变化：在汽车行驶过程中，进入隧道或停车场等场景时，车辆的网络状态会切换为弱网/无网状态，此时云端的语音资源就会切换为本地资源，切换顺滑度、音色相似度等都是典型问题；
多音字发音错误：机器未准确识别语境，发音错误；
断句错误：遇到没有标点符号或者标点符号错误的文本，机器未能识别，形成断句错误；
方言表达不地道：机器直接采用了文本的发音，未转换成方言发音。

例：

早上好，粤语应该说zou sen，而TTS会直接说早上好（粤语音调）。

没有，粤语应该说冇，而TTS会直接说没有（粤语音调）。

六、产品角度看车载TTS

1. 车载TTS的商业价值

车机作为第三个屏幕，其运营是一个说了很久的话题，但是目前真正在车机上实现商业化运营价值的车企却没有，而风格化回复语，没有安全性、政策等因素的限制，是目前能看到落地最快的方向之一，并且运营价值，如果能保证较低成本形成风格化回复语的情况下，对于具备较多智能存量车的车企来说，在我个人角度上来看为高。

2. 大模型对车载TTS可能的影响

一是个性化定制成本降低：大模型通过大量的数据学习，理想中可以快速对一些特定形象进行学习，降低学习成本，例如影视作品的角色，形成具有该角色风格的回复语。

二是更加快速合成结合业务的风格回复语：车载TTS更多的是结合业务的场景，例如导航去天安门、打开车门等，大模型结合业务将实现更加多变、准确、有趣的回复。

本文由@加饭原创发布于人人都是产品经理。未经许可，禁止转载。

题图来自 Unsplash，基于 CC0 协议

该文观点仅代表作者本人，人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

希望创立一个智能座舱社区，坚持每周分享智能座舱的观点

3篇作品 8710总阅读量

设计规范何时高效落地，助力业务提效？

08-162524 浏览

设计规范何时高效落地，助力业务提效？

B端产品如何利用AARRR模型实现增长

09-256429 浏览

B端产品如何利用AARRR模型实现增长

UI转产品，涨薪30%，只需90天：我的成功之路

刚刚

写给数据产品后浪们的修炼指南（一）科普篇

11-273502 浏览

写给数据产品后浪们的修炼指南（一）科普篇

如何给产品做“减法”？

07-045771 浏览

如何给产品做“减法”？

春江水暖鸭先知：洞悉AIGC技术趋势，把握内容产业变革的先机

10-173540 浏览

春江水暖鸭先知：洞悉AIGC技术趋势，把握内容产业变革的先机

评论

芝麻汤圆

您好，看了您的文章，我感觉受益匪浅，有个疑问想请教一下您，看您提到语音TTS可能会遇到“机器直接采用了文本的发音，不能转换为方言发音”，想请问转化成为粤语句式结构的中文文本后，不能直接对应成粤语的发音吗？

最近来自上海回复

开发转产品的成功之路：我给你的3个建议

年轻人佛系摆摊：边卖边送、不为赚钱、图个开心

08-222838 浏览
SaaS客户成功的裁撤潮，已经来了吗？

10-131838 浏览
大厂转行Web3指南：学会这5点，就能成为数字游民！

03-135182 浏览

12855人已学习13篇文章

如何做好产品战略规划？

在产品的不同生命周期，需要有对应的产品战略以应对市场。本专题的文章分享了如何做好产品战略规划。

45380人已学习12篇文章

个性化推荐算法是什么，怎么做？

产品经理和运营都要懂一点的推荐算法基础和进阶知识

67056人已学习3047篇文章

52956人已学习24篇文章

如何做裂变增长？

给每个运营人的裂变指南。

33058人已学习20篇文章

花钱也买不到的渠道运营经验，你一定不知道！

渠道运营是一个怎样的存在？

43104人已学习17篇文章

互联网产品盈利模式解读

谈到互联网产品，我们不得不谈的就是它的盈利方式，这也是产品人经常会被问到的问题。