当前位置:首页>车市快讯>综合报道>语音上车的十年——面向智能驾舱未来的角逐

语音上车的十年——面向智能驾舱未来的角逐

收藏 评论 编辑:王俊 来源:第一车市 时间:2019-09-30 16:48:12
image.png

  你好,博越

  [第一车市 新闻]中国汽车工业一路从无到有,从小到大,经过千万汽车人不忘初心的艰苦奋斗,中国如今也已经是名副其实的汽车大国,可以理直气壮地说,中国汽车工业与伟大祖国同呼吸、共命运,一起抒写了一段壮丽史诗。

  站在新的历史节点,新中国未来必然会更加强大,汽车强国则是其中必不可少的组成部分,而汽车强国之路离不开汽车智能化的发展。在全球汽车工业经过百年发展历程之后,一场以“智能化、网联化、电动化、共享化”为特征的产业革命和技术革命正在上演。汽车企业和科技公司无不积极思考人工智能、软件服务、生态平台、移动出行等发展方向的转型。汽车用户也不仅仅满足于汽车的操控、品牌、维修保养服务等基本元素,移动互联网式的用车体验和出行效率提升,也逐渐成为购车人群重点关注的内容。毋庸置疑,汽车行业进入了关键的产业变革时期。汽车从一个机械化的出行工具演变成融合高新科技的移动服务终端,在安全性能的基础上,用户会越来越追求驾乘之时的娱乐和舒适度。

  在智能化方向上,驾舱作为用户出行过程最重要的场景之一,也是新型技术快速应用和体验升级的关键所在。十年之前的2009年,Strategy Analytics就报告称语音交互和触摸屏结合的人机交互界面,将会成为未来智能驾舱中的主要交互方式,从安全和体验的角度具有无法替代的绝对优势。中国汽车语音市场走过了近十年,在这期间,从美国公司的垄断到中国本土技术公司的崛起和领先,从简单的命令词识别到自然语言对话、个性化、情感化交互。如今,中国本土的汽车语音交互技术和产品服务体验已经处于世界领先地位。追溯这段不寻常的发展历程,看中国汽车语音交互市场和产品的发展之路和未来趋势,这场面向智能驾舱未来的角逐将会由谁来指点江山?

image.png

  你好,Siri

  ■筚路蓝缕以启山林

  “你好 Siri!”是当下很多年轻人对智能语音有所认识的肇始。其实,早在上个世纪50年代,语音识别的研究工作就已经正式开始,AT&T Bell实验室实现了一个可识别十个英文数字的语音识别系统——Audry系统。1972年,IBM采用基于统计的方法将语音识别率提升到90%,单词规模也从几百个上升到两万,语音识别开始进入实际应用阶段。

  从2000年开始,国际汽车品牌就开始尝试搭载本地语音识别软件,希望用命令词识别的方式实现一些简单的控制功能。往后经过了十年的发展,汽车语音交互在降噪识别和命令词扩展方面有了一定的提升,但此时的语音交互还没有达到实际可用的体验状态,用户没有对语音交互的操作方式给予过多关注,语音交互被冷落成为一个鸡肋的功能。

  从2009年到2012年,美国公司Nuance是中国汽车市场的主要技术商,从合资品牌的车型入手开始应用其语音识别软件。此时,汽车语音交互产品还处于第一代,也就是命令词识别、单轮任务交互的阶段。这个阶段,用户在驾驶过程中可以通过语音指令来解决接听和拨打电话、听短信、播放MP3等场景的需求,提升了一定的操作安全性。但是在硬件上,主要还是单麦克风拾音和降噪的方式,在行驶高噪的环境下识别率降低十分明显。2013年之前,中国本土的人工智能企业和语音识别技术大多还没有涉足和应用在汽车领域,中国市场和中国用户的产品体验基本上是被美国Nuance垄断。

  随着人工智能技术和互联通信技术的发展,汽车语音交互的变革随之到来。基于DNN的语音识别技术架构的成熟和完善,让语音识别和语义理解的准确率获得较大的提升。中国移动互联网产业的高速发展,让车辆开始逐步接入3G和4G通信网络,更多的内容和服务进入了汽车场景。在这个过程中,中国本土的科大讯飞也将其从1999年开始,积累了十多年的语音技术和语音云平台能力释放到汽车领域,诱发了汽车语音交互技术和产品的变革,了满足中国人使用习惯的交互方式和服务体验。

  2011年到2013年,科大讯飞先后首发了汽车语音云+端的技术架构、车载双麦克风阵列降噪模块及算法,率先在汽车语音识别上应用了A.I.深度学习的技术,并在汽车语音交互应用中创新了语音唤醒、自然语言对话、Barge in任意打断等技术。在多年的合作中,逐步打造了从降噪、唤醒、窄波束、识别、声纹、自然语言理解、个性化合成、音效增强等全链的交互技术和产品方案。从上汽、长安吉利、江淮等车企的语音技术车型合作开始,到实现一汽、长安、北汽、广汽、吉利、长城、奇瑞、大众、斯柯达、日产等自主品牌和合资品牌在中国市场车型的语音交互系统平台化,再到在中国最早把语音交互产品搭载到雷克萨斯、沃尔沃等国际高端品牌车型中,科大讯飞稳步突破。根据JD power在2018年的中国汽车语音市场数据,科大讯飞2018年的470万前装搭载数量占中国市场的62%。从2019年上半年公布的数据看,这个数据还在稳步提升,汽车业务也发展成科大讯飞的七个核心业务之一。

  历史总会由创造历史的人来书写。2016年3月26日这一天,宁波北仑吉利博越会的现场,当吉利集团董事长李书福坐在车内,说出那句“你好,博越”的时候,可能没有人意识到,中国自主品牌汽车智能互联的新时代就此开启。作为吉利“造每个人的精品车”品牌使命下的首款智能互联SUV,吉利博越这套语音交互系统由国内语音厂商科大讯飞量身打造,识别率高、反应迅速,一改以往车内语音交互系统低效率的形象,让用户在车内通过语音就能够实现导航、听音乐等功能,也为博越打下了“好智能”的标签。自此之后,国内汽车厂商搭载语音系统的新车像雨后春笋般涌现,自主品牌也通过完全领先的车载系统,打开了与合资品牌竞争的新局面。“你好博越”事件成为了一个缩影,一个语音上车十年,中国语音厂商打好翻身仗,赋能汽车产业的缩影。

  随着语音交互的市场规模扩大,越来越多的中国本土人工智能和语音技术公司也得到了快速的发展,互联网企业也逐渐加入到汽车语音交互研究的队伍中。2016年,阿里入股在汽车后装市场上形成一定规模的语音技术公司思必驰,并在2017年成立达摩院并设立语音技术实验室,阿里巴巴也在2017年取代美国公司Nuance成为上汽荣威斑马系统的语音技术产品商,在汽车前装语音交互市场上占了一席之地。2017年,百度了DuerOS语音助理,并开始面向汽车领域进行实际的应用,其产品在星途、福特等品牌的部分车型上作为技术商进行搭载。除了百度和阿里之外,云知声、普强等公司也在产品和技术上不断跟进,并在细分市场上进行拓展。

  与此同时,在国际市场上,亚马逊的Alexa、微软的Cortana、苹果的Sir,更多的互联网技术巨头凭借其云端能力以及在其它行业应用的大数据和人工智能技术的积累,也逐步将自己打造的语音产品在国际市场上落地,展开车型合作,扩大市场规模。例如大众、福特、宝马等品牌在国际市场上引入了Alexa,微软利用Cortana结合Connected Vehicle平台输出给日产。

image.png

  科大讯飞飞鱼OS车机系统

  可以说过去的7年,中国本土崛起的人工智能公司快速打破了国外企业对汽车语音市场的垄断,并逐步在市场应用的规模上取得了领先地位,成为大部分自主和合资品牌产品选型的标配。同时,在产品和服务上,结合交互理念设计、系统级研发和生态内容集成的优势,为国人了更智能、高效、安全、人性化的沉浸式驾舱交互体验。

  ■中国特色语音交互

  当前的汽车语音交互已经进入了第二代,也就是基于内容搜索的上下文多轮交互阶段。从产品的准确性和可靠性上,语音交互已经成为车内最重要的交互方式,用户也逐步养成了对话汽车的使用习惯。相比于国际市场,中国的汽车市场及中国的汽车语音市场有其独特的背景特色。

  相比于西方语言,中文在多音字、多义词等语言特征上给语义理解带来了更大的挑战。同时,方言和少数民族语言是中国一个重要的地域特征,在汉语七大方言的框架之下又细分了次方言、地方方言等维度,可以说,各地语言千差万别。随着消费升级和大城市的限购限行政策,越来越多的三四线居民成为购车和出行的主力人群,让汽车真正能走进每一个地域听懂每个人的声音,是语音厂商直面的技术挑战。理解中国消费者的交互特征和习惯、解决方言多语种的交互门槛,才能打造出更全面的产品服务。

  此外,中国的信息和数据安全重视度已经上升到新的高度,语音数据作为一个重要和庞大的数据库,也得到了国家政府和车企的格外重视,对相关资质的审核也越来越严格。国务院在2017年了新一代人工智能四大创新开放平台,分别基于阿里、腾讯、百度、科大讯飞建设城市、医疗、自动驾驶、语音技术平台,从能力开放到信息安全上进行更高层面的规划和把控。这个大背景下,科大讯飞、亿咖通、博泰等一级商们开始为车企构建语音及AI技术的私有云,以更灵活、更安全的方式为车企构建核心能力支撑。

  中国的移动互联网产业发展是世界瞩目的,也正是拥有这样丰富和快速迭代发展的内容和服务资源,为车联网产业的发展了更好的基础,也提出了更多的要求。汽车不同于手机,汽车使用场景和手机使用场景也有着很大的差别。车联网相对于移动互联网,需要更关注汽车用户的真实需求和功能实用性而不能冗余,对功能和服务的稳定性、正确度、流畅性要求更高。在语音即服务的交互时代,如何以语音入口集成更好的车联网生态资源,打磨出更完美的系统级产品,需要语音厂商更懂用户、更懂汽车。在过去的几年里,我们也看到了一批行业标杆的产品陆续上市,先后出现了奇瑞艾瑞泽5、荣威RX5、吉利博越、蔚来ES8、广汽GS4、星图EXEED、长安CS95等高体验、好口碑的车型,不难看出中国自主品牌车企和中国本土的科大讯飞、亿咖通、思必驰、高德、腾讯音乐、百度等技术和互联网公司深度打造的驾舱语音交互系统正在引领着行业的发展,得到了中国消费者充分认可。

  随着国家“一带一路”政策促进周边国家共同发展、共同繁荣,为中国车企走出国门服务世界了更高的平台。中国汽车的海外发展离不开国际化技术和平台公司的支持,在汽车语音交互技术上,科大讯飞已经实现了了50多种语言的语音识别和机器翻译技术的应用。据了解,科大讯飞智能汽车业务已经在联合多家车企面向日、韩、俄、东南亚等外语市场打造智能化交互产品。

  正是这些中国汽车产业及汽车语音交互市场的特点,给广大的车企和科技互联网公司了丰沃的土壤。不难看出,以用户为中心、以产品升级为动力、以优质服务为方向,是中国汽车智能化变革发展的关键,也是做好驾舱语音交互产品和服务的方向。理解中国消费者的实际需求,充分研究中国消费者的用车和交互习惯,才能立足于技术优势,打磨出高质量的体验。

image.png

  充分交互的智能移动终端

  ■更多可能大有可为

  语音上车的十年,带来的改变毫无疑问是巨大的,而看未来,汽车人机交互系统所承载的价值将有丰富的想象空间。其核心原因其实在于汽车的本质。作为人类出行移动服务的载体,汽车是为人类而生,价值也就由驾乘人员所决定,在整个的出行过程中,除了人机交互系统外,没有哪一个车身零部件可以构建一整套的以人为中心的价值链和服务体系。因此,汽车语音交互市场的竞争也会更加精彩,从核心技术、大数据积累、云平台能力、面向企业客户的定制化服务能力、对消费者的研究等,都会成为未来汽车语音交互领域突破的重要基础。第三代汽车语音交互,也就是基于智能驾舱的多模态、个性化、情感化、多音区的交互阶段已经开始到来。

  未来以语音交互为核心,融合手势识别、表情识别等多模态协作的方式可以更好的完成交互过程。例如通过语音识别和表情识别融合的方式,结合驾驶员当前所处的场景来判断其心理情绪,自动语音打开合适类型的音乐,开启相对应的氛围灯,调节车内氛围以适应车内用户的当下心情,给用户更亲和、更智能化、更沉浸式的体验感受。

  同时,从现阶段相对成熟的双音区交互技术发展为四音区、六音区交互技术,可以让每个位置的乘客通过语音或者其他交互方式控制各自的交互设备,即使在同一时间同汽车进行对话也互不影响。在多音区交互的基础上,结合座舱音效增强和多区域声场构建的技术,让每个座位的乘客都能沉浸在自己想要的服务之中而不受其它位置的影响,将极大的提升了体验的舒适度和信息的私密性,为同一辆车的每位乘客构建了一个属于自己的交互服务空间。

  甚至,通过全息投影技术实现的“虚拟个人助理”将会让整个车机系统更炫酷、更智能、更具科技感。它还可以自主学习并分析用户的日常行为以及爱好,对于用户提出的问题,可以根据分析的结果给出用户更个性化更贴合用户心理的答案,可以结合用户当前所处的场景和说话内容,充分理解用户意图。此外,还能够主动给用户一些引导、帮助和建议,颠覆现在人面向车的被动交互情况,转变为车面向人的主动交互行为。真正让汽车服务于人,让汽车比人更懂自己的需要,在车内实现人机的情感化、个性化交互的终极目标。

  造中国车,说中国话,展望新十年,以科大讯飞等为代表的中国智能语音科技公司,有望书写属于中国汽车工业的“智能化”灿烂篇章,让亿万车主聆听来自东方的声音。

相关阅读
已有
 
参与评论
网友评论
↓点击加载更多评论
团购报名
*姓名
*手机
 意向
精选图文
本周本月热点新闻
关于网站
申请友链 联系方式
招聘信息 隐私条款
网络营销 分站合作
关于我们
帮助导航
服务中心常见问题
积分兑换网站地图
意见反馈手机应用
常用工具
汽车报价车型对比
品牌查询商家地图
购车工具咨询低价
联系我们