语音引擎的现状

来源:
浏览次数: 105
   在2019年,语音引擎变得更加复杂,现在能够支持其他语言和方言,但也还有更多工作要做。这些解决方案,包括语音到文本,文本到语音,语音识别,语音命令和控制,语音搜索,转录,翻译以及相关活动的技术,现在在识别单词方面做得更好,但具有讽刺意味的是,这种能力并不是用户最终想要的。相反,他们需要可以像人一样对它们做出反应的系统。但是,对于供应商而言,实现该目标仍然遥遥无期。
语音引擎的现状
  年度回顾
  在2019年添加的新语言和方言中,亚马逊的Alexa现在支持印地语语音交互。此外,该供应商还增强了系统以了解当地流行语言的变体,例如美国西班牙语和巴西葡萄牙语,从而使更多的消费者可以查看天气,控制智能家居设备以及使用亚马逊品牌的设备听音乐。Bose,LG电子和索尼等第三方访问Alexa语音服务应用程序编程接口(API)来开发Alexa Skills。
  LumenVox还扩展了其系统的支持范围,以支持本地方言,例如美国,英国澳大利亚人,新西兰英语和北美西班牙语。
  而且由于许多个人和家庭说多种语言,因此Amazon Web Services进一步引入了多语言模式,该模式允许Alexa在两种语言之间切换。该系统通过识别用户说出的语音并以相同的语言进行响应来自动进行调整。此功能分为三对可用:美国的英语和西班牙语,印度的印度英语和北印度语以及加拿大的英语和法语。
  LumenVox客户服务副总裁Jeff Hopper表示,与此类似,LumenVox还添加了一个新的转录引擎,专门针对无音频格式。他解释说:“它可以实时工作,因此[交互式语音响应(IVR)]应用程序不仅可以接收结构化数据或自然语言输入,还可以处理原始文本。”
  但是,对于整个语音行业来说,更有意义的是人工智能(AI)和深度神经网络正在开展的工作。人工智能工作已迅速进入主流语音技术,允许更多自然语言,对话交互,并且随着引擎处理越来越多的语音,机器学习使系统的准确性和性能得以提高。
  今年,第四代深度神经网络(DNN)的出现也显示了语音引擎的进步。它们在输入和输出之间具有多层,因此可以使用线性或非线性关系得出结论。
  Nuance Communications是该领域的领导者,该公司在7月推出了Nuance Lightning Engine,这是一种DNN,结合了语音生物识别技术和自然语言理解,可以跨语音渠道提供个性化,人性化的体验。
  展望未来
  尽管语音引擎已在许多方面得到了改进,但基础技术仍存在很多缺点。根据Booz,Allen&Hamilton的前专业人士StephenArnold的说法,当今的系统在识别单个单词方面明显要好得多,但需要的是能够在上下文中理解单词的解决方案。
  由于此限制,当将语音系统部署为企业和消费者使用时,它们有时无法正常运行。用户专注于最终结果,例如从语音搜索中获取结果,但是系统通常无法提供所需的理解水平。因此,根据普华永道最近的一项调查,有71%的美国人更愿意与人互动,而不是聊天机器人或其他自动化过程。
  供应商正在完善他们的系统以弥合这一差距。Google开发了BERT(来自“变形金刚”的双向编码器表示),这是一种语音识别解决方案,旨在连接单词和更好地理解句子上下文。例如,如果某人正在寻找有关在另一个国家旅行的信息,则BERT会认识到“去(to)”一词比“来自(from)”更重要。
  类似地,Translate Your World一直在构建语音解决方案,以识别对话中的语气,并且供应商发现,各个人的语气会因情况而异。“最终目标是指导AI翻译,以便它们在对话的背景下为与个人打交道提供正确的模式,”该公司总裁SueReager解释说。例如,“shingles”一词通常是指房屋屋顶上的物品,但在医疗保健领域,它代表病毒感染。
  同样,交流因群体而异。“我们发现,消费者通常不会像企业高管那样讲的很清楚。”Reager补充说:“消费者的发音有时不清楚,他们通常不使用完整的句子。他们的思想缺乏组织,因此有时很难找到固定的模式。”
  培训语音引擎以识别和适当地应对此类差异是她的公司以及其他多个行业细分领域将在2020年解决的问题。
  谁来承担当前的语音挑战一直在变化。“试图翻译语音变得越来越困难,而且非常昂贵,”Arnold坚持认为。“在过去的日子里,麻省理工学院机器学习实验室的一些人能够建立一个商业系统。但是不做了。”
  如今,语音引擎的研究需要大量资金,高技能的数据科学家和庞大的数据中心,而这些数据中心将拥有巨大的计算处理能力。因此,谷歌,亚马逊网络服务,微软和IBM等国内行业巨头正在承担许多工作。
  在国际上,中国公司,例如百度,也在挑战这些问题。根据Arnold的说法,中国供应商之所以处于有利地位,是因为它们不受传统技术的束缚,可以采用新的方法来解决这些长期存在的问题。
  供应商在扩展其产品功能方面也取得了进展,因此他们支持更多类型的语音,但是仍需要努力以帮助该技术将单个单词置于上下文中,以便系统可以适当地响应。随着市场的变化,开发负担急剧增加。展望未来,似乎只有财大气粗的行业巨头才能拥有推动语音解决方案前进所需的资源,从而变得更加人性化。

  作者:Paul Korzeniowski
  原文网址:https://www.speechtechmag.com/Articles/Editorial/Features/The-State-of-Speech-Engines-139107.aspx


  • 相关资讯 More
  • 点击次数: 122
    2022 - 04 - 18
    本文是从我们的“联络中心现在正在做什么”2021年调查报告中摘录的人工智能章节,该报告由Nuance赞助。  你的人工智能战略在哪里?  超过一半的联络中心制定了人工智能战略  整个联络中心行业对人工智能的需求很明显,51.8%的联络中心已经制定了特殊战略。  当然,对于许多联络中心来说,这一策略仍处于初级阶段--30.4%的参与者表示他们正在“努力”。  还有一些正在取得令人瞩目的进展。9.4%制定了联合战略,另有12.0%实施了部门战略。  总之,这些调查结果表明,超过五分之一的联络中心已经完成了一个重大的人工智能项目。  实施人工智能的最大驱动力是什么?  客户满意度正在推动AI增长  60.3%的行业专业人士表示,客户满意度是人工智能技术实施的关键驱动力。这使其成为大多数联络中心的最大动力。  考虑到自动化技术的成本削减能力,这相当令人惊讶。然而,47.4%的参与者也认为“降低成本”是主要动力,而51.6%的参与者认为减少接触是实施人工智能的关键目标。  这些发现或许表明,在客户和业务成果方面取得正确的平衡是一个重要的考虑因素。因此,没有一个明确的推动人工智能采用的驱动因素。  更多人工智能动机  除了图表中列出的每个选项外,6.8%的参与者指出了实施联络中心AI的其他几个目标。其中包括:提高客户忠诚度/终身价值创建更好的座席支持系统改善员工体验降低人员配备要求使用聊天机器人提供另一个客户服务渠道  您觉得以下各项AI技术有多令人兴奋?  交互分析抢尽风头  交互分析似乎是最能吸引联络中心领导者注意力的基于人工智能的技术。  近三分之二的受访者认为该软件“非常令人兴奋”,另有26.3%的人对其潜力感到有些兴奋。  超过一半的参与者对此感到非常兴奋的其他人工智能工具包括预测路由(56.5%)、客户预测建模(52.7%)和自动洞察生成(52.4%)。  增强现实并没有设...
  • 点击次数: 147
    2022 - 04 - 11
    了解一家财富500强公司的RFQ流程的幕后情况,该公司在全球排名前50位,并且在演示阶段达到了超过90%的意图识别。  我们展示了企业对其技术提供商的需求以及他们如何设置RFQ。  在这种情况下,我们正在寻找来自金融业的世界上最大的公司之一,该公司已经建立了如此精确的选择过程,以至于它可以揭露任何不适合陪伴它走向成功的供应商。  第1步:确定主要目标  尽早确定他们的目标使设置流程更容易,并帮助他们在RFQ流程中保持专注。映射的场景简短但准确。  范围:每年9000万次通话  主要目标:4000万次呼叫的自动化(45%)加快服务时间大幅降低成本  大体时间:在两年内实现45%的呼叫自动化  第2步:创建必备需求  知道目标应该是什么是一个很好的开始,但第二步是找出要比较的内容。只有客户接受甚至享受对话式AI体验,才能实现上述目标。  出色的用户体验始终以成熟的功能为后盾,这些功能可以自然地引导用户并解决他们的请求。此外,平台的灵活性和全球理解对于能够轻松适应新环境非常重要。  要求清单被归结为五个主要类别,并进行了彻底调查。  比较类别:  企业就绪不可知:与多个NLU和语音提供程序兼容可扩展符合GDPR培训材料和计划  产品可用性和灵活性低代码且功能丰富与其他平台的现成集成本地支持自助服务就绪,使业务部门能够以最少的技术参与来维护机器人  面向未来解决方案和产品路线图云原生拥有强大客户基础的成熟供应商广泛的SLA能够在内部构建AI模型无监督机器人学习  全球范围多种托管选项全球服务集成商网络满足当地语言和法律要求  语音专长丰富的语音(不仅仅是聊天)体验电话和联络中心集成大型NLU和ASR库  第3步:通过PoC进行验证  但是,填充这个清单并不意味着它已经完成了。演示座席应作为决策的最终依据,并能够识别90%的呼叫者的意图并正确地服务或路由它们。  Cognigy的顾问...
  • 点击次数: 99
    2022 - 04 - 04
    毫无疑问,联络中心座席的工作要求很高。从处理愤怒的客户到回答许多问题,再到遵循复杂的流程,座席每天都面临着挑战。  因此,行业流失率很高。每年有30-45%的联络中心座席辞职。考虑到失去一名员工的成本可能相当于其年薪的1-2倍,联络中心需要保持员工的积极性、赞赏性和与工作的联系。但是联络中心经理如何实现这些目标呢?  一种方法是通过不断追求员工敬业度。  员工敬业度被定义为激励员工尽其所能的情感心态。正是这条线索让投资的座席保持最高水平的表现。  这也是提高底线、士气和联络中心成功的门票。因此,联络中心经理必须认可员工的表现并表现出他们对座席的赞赏。  为什么你应该考虑认可员工  座席来来去去。缺勤率和离职率可能具有挑战性。寻找新员工既昂贵又费时又费力。这就是为什么认可联络中心座席并为他们的辛勤工作表达赞赏如此重要的原因。  在我们关注数字的同时,也越来越关注座席的福祉和士气。  认可联络中心员工的好处:座席的生产力更高。69%的员工在感到受到赞赏时会更加努力,敬业的团队比不敬业的团队生产力高17%。参与意味着他们对自己的工作有真正的承诺,因此,他们真正渴望做到最好。座席在通话上花费更多时间。敬业的联络中心员工解决客户问题和投诉的动力提高了3.3倍。积极主动的座席更有可能对客户需求产生同理心,并且会更加努力地找到可行的解决方案。这会对底线、生产力和客户满意度产生积极影响。提升客户体验。敬业的联络中心座席感觉与他们的工作有着更深层次的联系。这转化为对工作的真正兴趣,并提升客户服务。提高士气。无论您的职位是什么,我们所有人都希望获得对我们工作的认可。37%的员工受到个性化认可的鼓舞和激励。这对于提高士气和增加联络中心员工的信心大有帮助。更好的保留率。在招聘顶级人才时,实施员工敬业度计划势在必行。根据Glassdoor的一项调查,如果得到主管的更多认可,53%的员工会在工作中停留...
  • 点击次数: 113
    2022 - 03 - 28
    当客户面临混乱的IVR菜单、漫长的等待时间时,他们可能会在座席接听电话之前放弃呼叫。  根据行业估计,大约5%到8%的呼入电话因各种原因放弃,所有这些都是错失的机会。  一个放弃的电话可能会对品牌产生负面印象,客户可能不愿意第二次联系。这就是为什么衡量呼叫放弃率并主动管理此指标以改善客户体验(CX)很重要的原因。  什么是呼叫放弃率?  呼叫放弃率(Call Abandon Rate)是指在座席有机会连接到线路之前发起呼叫中心交互但放弃的客户百分比。  一定数量的放弃呼叫是不可避免的,但由于以下原因,它们可能会增加:座席短缺,导致排队过长IVR菜单会多次重定向客户并导致混淆增加挫败感的响亮或烦人的保持音乐烦人的IVR消息传递,例如在满是沮丧的客户的队列中进行促销即使有座席,系统瓶颈也会阻止呼叫  降低呼叫放弃率的想法  降低放弃率的最简单(但通常也是最昂贵的)方法是雇佣更多的座席。理想情况下,呼叫中心将始终拥有最佳的人力资源,以将等待时间降至最低。  然而,联系量的意外高峰是不可避免的。针对此类场景,呼叫中心可以尝试以下创新措施:  1.为意外做好准备  创建一组标准操作程序(SOP),以便每个人都知道当联络中心失去对等待时间的控制时该怎么做。向谁寻求支持以及按什么顺序寻求支持的简单说明将使经理能够更好地管理风暴。  2.让等候体验更有吸引力  如果等待体验为客户增加价值,他们就不太可能中途放弃。它甚至可以减轻来电者的紧迫感和焦虑感,这通常是客户因困难和加重问题而打电话时的情况。  消息甚至可以介绍竞赛和赠品。然而,也许最好的例子是有趣的事实。例如,一个健康和休闲中心可以播放这样的信息:“你知道去桑拿可以帮助我们排出体内的毒素吗?与座席交谈,了解更多关于我们的水疗体验的信息。”这是一种突出其他可能产品价值的微妙方式,听起来不像广告。  3.让客户请求回电  降低放弃率的另一...
Copyright ©2017 四川西沃信息技术有限公司
犀牛云提供企业云服务