语音引擎的现状

来源:
浏览次数: 122
   在2019年,语音引擎变得更加复杂,现在能够支持其他语言和方言,但也还有更多工作要做。这些解决方案,包括语音到文本,文本到语音,语音识别,语音命令和控制,语音搜索,转录,翻译以及相关活动的技术,现在在识别单词方面做得更好,但具有讽刺意味的是,这种能力并不是用户最终想要的。相反,他们需要可以像人一样对它们做出反应的系统。但是,对于供应商而言,实现该目标仍然遥遥无期。
语音引擎的现状
  年度回顾
  在2019年添加的新语言和方言中,亚马逊的Alexa现在支持印地语语音交互。此外,该供应商还增强了系统以了解当地流行语言的变体,例如美国西班牙语和巴西葡萄牙语,从而使更多的消费者可以查看天气,控制智能家居设备以及使用亚马逊品牌的设备听音乐。Bose,LG电子和索尼等第三方访问Alexa语音服务应用程序编程接口(API)来开发Alexa Skills。
  LumenVox还扩展了其系统的支持范围,以支持本地方言,例如美国,英国澳大利亚人,新西兰英语和北美西班牙语。
  而且由于许多个人和家庭说多种语言,因此Amazon Web Services进一步引入了多语言模式,该模式允许Alexa在两种语言之间切换。该系统通过识别用户说出的语音并以相同的语言进行响应来自动进行调整。此功能分为三对可用:美国的英语和西班牙语,印度的印度英语和北印度语以及加拿大的英语和法语。
  LumenVox客户服务副总裁Jeff Hopper表示,与此类似,LumenVox还添加了一个新的转录引擎,专门针对无音频格式。他解释说:“它可以实时工作,因此[交互式语音响应(IVR)]应用程序不仅可以接收结构化数据或自然语言输入,还可以处理原始文本。”
  但是,对于整个语音行业来说,更有意义的是人工智能(AI)和深度神经网络正在开展的工作。人工智能工作已迅速进入主流语音技术,允许更多自然语言,对话交互,并且随着引擎处理越来越多的语音,机器学习使系统的准确性和性能得以提高。
  今年,第四代深度神经网络(DNN)的出现也显示了语音引擎的进步。它们在输入和输出之间具有多层,因此可以使用线性或非线性关系得出结论。
  Nuance Communications是该领域的领导者,该公司在7月推出了Nuance Lightning Engine,这是一种DNN,结合了语音生物识别技术和自然语言理解,可以跨语音渠道提供个性化,人性化的体验。
  展望未来
  尽管语音引擎已在许多方面得到了改进,但基础技术仍存在很多缺点。根据Booz,Allen&Hamilton的前专业人士StephenArnold的说法,当今的系统在识别单个单词方面明显要好得多,但需要的是能够在上下文中理解单词的解决方案。
  由于此限制,当将语音系统部署为企业和消费者使用时,它们有时无法正常运行。用户专注于最终结果,例如从语音搜索中获取结果,但是系统通常无法提供所需的理解水平。因此,根据普华永道最近的一项调查,有71%的美国人更愿意与人互动,而不是聊天机器人或其他自动化过程。
  供应商正在完善他们的系统以弥合这一差距。Google开发了BERT(来自“变形金刚”的双向编码器表示),这是一种语音识别解决方案,旨在连接单词和更好地理解句子上下文。例如,如果某人正在寻找有关在另一个国家旅行的信息,则BERT会认识到“去(to)”一词比“来自(from)”更重要。
  类似地,Translate Your World一直在构建语音解决方案,以识别对话中的语气,并且供应商发现,各个人的语气会因情况而异。“最终目标是指导AI翻译,以便它们在对话的背景下为与个人打交道提供正确的模式,”该公司总裁SueReager解释说。例如,“shingles”一词通常是指房屋屋顶上的物品,但在医疗保健领域,它代表病毒感染。
  同样,交流因群体而异。“我们发现,消费者通常不会像企业高管那样讲的很清楚。”Reager补充说:“消费者的发音有时不清楚,他们通常不使用完整的句子。他们的思想缺乏组织,因此有时很难找到固定的模式。”
  培训语音引擎以识别和适当地应对此类差异是她的公司以及其他多个行业细分领域将在2020年解决的问题。
  谁来承担当前的语音挑战一直在变化。“试图翻译语音变得越来越困难,而且非常昂贵,”Arnold坚持认为。“在过去的日子里,麻省理工学院机器学习实验室的一些人能够建立一个商业系统。但是不做了。”
  如今,语音引擎的研究需要大量资金,高技能的数据科学家和庞大的数据中心,而这些数据中心将拥有巨大的计算处理能力。因此,谷歌,亚马逊网络服务,微软和IBM等国内行业巨头正在承担许多工作。
  在国际上,中国公司,例如百度,也在挑战这些问题。根据Arnold的说法,中国供应商之所以处于有利地位,是因为它们不受传统技术的束缚,可以采用新的方法来解决这些长期存在的问题。
  供应商在扩展其产品功能方面也取得了进展,因此他们支持更多类型的语音,但是仍需要努力以帮助该技术将单个单词置于上下文中,以便系统可以适当地响应。随着市场的变化,开发负担急剧增加。展望未来,似乎只有财大气粗的行业巨头才能拥有推动语音解决方案前进所需的资源,从而变得更加人性化。

  作者:Paul Korzeniowski
  原文网址:https://www.speechtechmag.com/Articles/Editorial/Features/The-State-of-Speech-Engines-139107.aspx


  • 相关资讯 More
  • 点击次数: 181
    2022 - 06 - 27
    随着我们进入新的十年,呼叫中心自动化的实施正在加速,因此,企业实施最佳实践至关重要,否则就有可能落后于竞争对手。  机器人过程自动化(RPA)、人工智能(AI)和机器学习(ML)方面的技术进步正在改变客户服务的面貌。然而,仅仅因为您可以在呼叫中心自动化某些事情,并不意味着您应该这样做。要知道哪些任务应该交给人工智能和机器是一个挑战。  在本文中,我们解释了成功实现呼叫中心自动化的最重要的方法,概述了呼叫中心正在实施的一些主要的呼叫中心自动化工具类型,并讨论了在您的CX自动化方法中优化人类和人工智能之间的平衡的好处。  联络中心和呼叫中心的智能自动化  根据我们的经验,最重要的呼叫中心自动化最佳实践是平衡核心服务目标和KPI与自动化,以不断提高客户体验和运营效率。为了优化为客户和员工提供的全渠道服务,您必须知道何时利用来自实时座席的人工交互,以及何时部署人工智能驱动的虚拟助理和自动化流程。在呼叫中心自动化方法中找到这种完美的平衡就是我们所说的'深思熟虑的自动化'。  呼叫中心的智能自动化除了控制成本外,还有几个用途。例如,最常讨论的应用程序是自动化简单的、耗时的应用程序。重复的任务。这有助于减少总体处理时间,并允许联络中心座席参与更复杂的以客户为中心的交互。但这只是自动化改善呼叫中心运营的开始。自动化可以在幕后帮助员工,帮助他们做出更好、更快的决定。它还可以用于扩大数字服务知识获取、编纂和应用,并在长期内提高客户服务质量。  总之,以下是最常见的呼叫中心自动化趋势:  1. 聊天机器人和主动倾听,如自然语言处理(NLP)和自然语言理解(NLU),在客户交互过程中通过聊天机器人或语音助手促进自然语言生成(NLG)和会话UI工具。  2. 机器人过程自动化(RPA)取代了Tier0层面和其他面向任务和可编程的简单交互。数字工人工厂模型不是为每个任务部署单独的机器人...
  • 点击次数: 128
    2022 - 06 - 20
    Odigo 的 Vincent Lascoux 解释了如何在客户服务中建立成功且可持续的对话体验。  一个品牌现在被期望创造出在任何时候、任何地方和所有平台上都可以访问的内容或服务。机器人(语音机器人和聊天机器人)可以满足这些新的客户需求:对话体验的速度和个性化、可用性和全渠道。  它们还通过自动化低优先级、低复杂性的请求(例如关于营业时间的查询)来帮助平衡联络中心的高峰。  公司已经在整合这些原则,会话式 AI 市场正在经历显着加速,预计到 2024 年增长将超过 30%。在客户服务中,成功的会话式体验的关键是会话式用户体验 (UX) 专业知识,但也支持通过全渠道、开放和强大的解决方案。  使用经过验证的用户体验方法构建对话之旅和体验  成功的客户旅程需要会话 UX 专业知识来实现流畅的体验。这些可以最大限度地减少客户的工作量并提供快速访问正确答案的途径。用户体验专家考虑了许多指导对话体验发展的要素:用户意图或需求使用环境历史技术限制。  谷歌 Google Assistant 设计经理 Cathy Pearl 将对话体验进步的目标总结为:'教计算机如何更像人类一样交流,而不是相反。'  机器人对话的措辞自然会影响客户的回答,从而影响识别率,以及识别文本或语音的准确度。  如果遇到问题或遇到客户沉默,系统应配置为提供替代选项、改写或使用封闭式问题。有时休息一下,让客户可以寻找额外的信息(如保单号码),然后从他们离开的地方继续,这是有益的。  为了提高机器人的准确性,可以使用自然的客户对话进行培训,以帮助提供行业特定语言的真实示例以及客户通常表达自己查询的方式。  客户的对话体验可以通过多种渠道进行,而不仅仅是语音,只要集成了不同的人工智能服务,这种共享信息还可以创建更准确的客户旅程个性化。  但是,为了促进客户参与,定义与品牌价值和用例一致的机器人角色或个...
  • 点击次数: 112
    2022 - 06 - 13
    在当今时代,负面的客户体验可以破坏组织的声誉。然而,这种决定成败的关键能力只会在医疗保健领域得到放大。   该领域的来电者不仅是客户--他们是需要帮助、指导和护理的患者。在这个行业中,提供响应迅速、安全和高质量的患者护理和体验是重中之重。  优化联络中心运营的 4 大方法  联络中心是一个信息中心,记录、保留和存储数以千计的客户互动。通过利用这些数据,联络中心有可能提取有意义的见解,以增强客户体验并提高运营效率。  自 1990 年代以来一直处于紧急护理的前沿,Integrated Care 24 (IC24) 开展的工作是医疗保健组织如何利用未使用数据可以带来的丰富知识的一个很好的例子。  通过实施语音和文本分析解决方案,IC24 能够确定医疗保健组织可以优化其联络中心运营的 4 种方式:  1. 识别数据集之间的相关性和趋势  能够识别联络中心内 100% 的对话对于改善患者呼叫处理程序的体验至关重要。通过捕获这些通信,然后可以在分析工具中报告它们,使用包括情绪分析、串扰和非谈话在内的多个指标。  通过这样做,联络中心可以轻松识别数据集之间的相关性,以发现有价值的见解。这反过来又可以帮助纠正患者体验中的任何瓶颈。  2. 查看呼叫处理流程  呼叫处理流程是患者体验的重要组成部分。间歇性地审查这一点可以帮助隔离损坏的工作流程和需要改进的领域。  例如,通过使用分析,IC24 确定呼叫者在呼叫 111 时听到的预先录制的消息在呼叫处理过程的另一部分重复。通过消除重复,IC24 将其总平均通话时间减少了 3.5%,同时呼叫者的满意度也提高了。  此外,从分析解决方案中提取的宝贵数据还使 IC24 能够改进其质量改进工作流程。通过从人口统计数据收集脚本中删除两个呼叫处理程序语句,IC24 受益于整个时间当量 (WTE) 节省超过 66,000 英镑。  3.分析审计过...
  • 点击次数: 121
    2022 - 06 - 06
    许多联络中心正在摆脱传统的轮班模式,以改善客户服务并提高生产力。  现在,他们正在实施几种创新的轮班模式,以更好地满足预测需求和员工偏好。这里有五个很好的例子。  1、拆分班次  拆分班次将工作日分为两个或多个部分。两者之间的间隔超过一个小时的午休时间,让员工有更多时间享受爱好、完成诸如接孩子放学等任务或只是放松一下。  计划人员必须提前安排分班;请求延长休息时间不计算在内。毕竟,WFM团队经常实施分班制,以确保大多数员工在高峰期处理联系人,这需要精心计划。  事实上,大多数操作在一天中间的联系量都处于停顿状态。因此,实施从上午11点到下午2点休息三个小时的分班制是标准做法。  大流行助长了这种分班制的增长,因为它们对远程座席很方便。然而,对于在职团队来说,这通常不是最好的轮班模式。为什么?因为对于大多数员工来说,每天两次通勤上班并不理想。  2、微班次  与拆分班次一样,微班次是远程座席的绝佳选择。这些轮班可以持续短短两个小时甚至30分钟,非常适合在一天中的特定时间经历大量联系的联络中心。  这些转变对于雇用大学生的联络中心特别有利,因为他们可能在讲座和研讨会之间有几个小时的空闲时间来登录。  提供这些轮班也有助于从团队中获得更多时间。例如,一些兼职人员可能喜欢每周多做一两个小时,只要他们能适应他们的日程安排。鉴于当前的生活成本危机,许多座席将欢迎这样的机会,而联络中心则享有更大的覆盖范围。  3、有倾向性的轮班  由领先的WFM供应商injixo创造,倾斜轮班为座席提供了每周工作40小时的机会。但是,每天的时间并没有平均分配。  取而代之的是,工作周折衷为周一工作10小时、周二工作9小时、周三工作8小时、周四工作7小时、周五工作5小时。  这种轮班模式在联系量随着一周的进行而下降的运营中是理想的。此外,许多座席喜欢这样的时间表,因为它可以让他们享受更轻松的一周结束。  ...
Copyright ©2017 四川西沃信息技术有限公司
犀牛云提供企业云服务