语音引擎的现状

来源:
浏览次数: 102
   在2019年,语音引擎变得更加复杂,现在能够支持其他语言和方言,但也还有更多工作要做。这些解决方案,包括语音到文本,文本到语音,语音识别,语音命令和控制,语音搜索,转录,翻译以及相关活动的技术,现在在识别单词方面做得更好,但具有讽刺意味的是,这种能力并不是用户最终想要的。相反,他们需要可以像人一样对它们做出反应的系统。但是,对于供应商而言,实现该目标仍然遥遥无期。
语音引擎的现状
  年度回顾
  在2019年添加的新语言和方言中,亚马逊的Alexa现在支持印地语语音交互。此外,该供应商还增强了系统以了解当地流行语言的变体,例如美国西班牙语和巴西葡萄牙语,从而使更多的消费者可以查看天气,控制智能家居设备以及使用亚马逊品牌的设备听音乐。Bose,LG电子和索尼等第三方访问Alexa语音服务应用程序编程接口(API)来开发Alexa Skills。
  LumenVox还扩展了其系统的支持范围,以支持本地方言,例如美国,英国澳大利亚人,新西兰英语和北美西班牙语。
  而且由于许多个人和家庭说多种语言,因此Amazon Web Services进一步引入了多语言模式,该模式允许Alexa在两种语言之间切换。该系统通过识别用户说出的语音并以相同的语言进行响应来自动进行调整。此功能分为三对可用:美国的英语和西班牙语,印度的印度英语和北印度语以及加拿大的英语和法语。
  LumenVox客户服务副总裁Jeff Hopper表示,与此类似,LumenVox还添加了一个新的转录引擎,专门针对无音频格式。他解释说:“它可以实时工作,因此[交互式语音响应(IVR)]应用程序不仅可以接收结构化数据或自然语言输入,还可以处理原始文本。”
  但是,对于整个语音行业来说,更有意义的是人工智能(AI)和深度神经网络正在开展的工作。人工智能工作已迅速进入主流语音技术,允许更多自然语言,对话交互,并且随着引擎处理越来越多的语音,机器学习使系统的准确性和性能得以提高。
  今年,第四代深度神经网络(DNN)的出现也显示了语音引擎的进步。它们在输入和输出之间具有多层,因此可以使用线性或非线性关系得出结论。
  Nuance Communications是该领域的领导者,该公司在7月推出了Nuance Lightning Engine,这是一种DNN,结合了语音生物识别技术和自然语言理解,可以跨语音渠道提供个性化,人性化的体验。
  展望未来
  尽管语音引擎已在许多方面得到了改进,但基础技术仍存在很多缺点。根据Booz,Allen&Hamilton的前专业人士StephenArnold的说法,当今的系统在识别单个单词方面明显要好得多,但需要的是能够在上下文中理解单词的解决方案。
  由于此限制,当将语音系统部署为企业和消费者使用时,它们有时无法正常运行。用户专注于最终结果,例如从语音搜索中获取结果,但是系统通常无法提供所需的理解水平。因此,根据普华永道最近的一项调查,有71%的美国人更愿意与人互动,而不是聊天机器人或其他自动化过程。
  供应商正在完善他们的系统以弥合这一差距。Google开发了BERT(来自“变形金刚”的双向编码器表示),这是一种语音识别解决方案,旨在连接单词和更好地理解句子上下文。例如,如果某人正在寻找有关在另一个国家旅行的信息,则BERT会认识到“去(to)”一词比“来自(from)”更重要。
  类似地,Translate Your World一直在构建语音解决方案,以识别对话中的语气,并且供应商发现,各个人的语气会因情况而异。“最终目标是指导AI翻译,以便它们在对话的背景下为与个人打交道提供正确的模式,”该公司总裁SueReager解释说。例如,“shingles”一词通常是指房屋屋顶上的物品,但在医疗保健领域,它代表病毒感染。
  同样,交流因群体而异。“我们发现,消费者通常不会像企业高管那样讲的很清楚。”Reager补充说:“消费者的发音有时不清楚,他们通常不使用完整的句子。他们的思想缺乏组织,因此有时很难找到固定的模式。”
  培训语音引擎以识别和适当地应对此类差异是她的公司以及其他多个行业细分领域将在2020年解决的问题。
  谁来承担当前的语音挑战一直在变化。“试图翻译语音变得越来越困难,而且非常昂贵,”Arnold坚持认为。“在过去的日子里,麻省理工学院机器学习实验室的一些人能够建立一个商业系统。但是不做了。”
  如今,语音引擎的研究需要大量资金,高技能的数据科学家和庞大的数据中心,而这些数据中心将拥有巨大的计算处理能力。因此,谷歌,亚马逊网络服务,微软和IBM等国内行业巨头正在承担许多工作。
  在国际上,中国公司,例如百度,也在挑战这些问题。根据Arnold的说法,中国供应商之所以处于有利地位,是因为它们不受传统技术的束缚,可以采用新的方法来解决这些长期存在的问题。
  供应商在扩展其产品功能方面也取得了进展,因此他们支持更多类型的语音,但是仍需要努力以帮助该技术将单个单词置于上下文中,以便系统可以适当地响应。随着市场的变化,开发负担急剧增加。展望未来,似乎只有财大气粗的行业巨头才能拥有推动语音解决方案前进所需的资源,从而变得更加人性化。

  作者:Paul Korzeniowski
  原文网址:https://www.speechtechmag.com/Articles/Editorial/Features/The-State-of-Speech-Engines-139107.aspx


  • 相关资讯 More
  • 点击次数: 107
    2021 - 03 - 22
    人们通常认为,良好的客户服务意味着100%的座席都在打电话,让客户尽快与座席通话。与普遍的看法相反,如果你的联络中心是这样工作的,那可能意味着你实际上没有有效地利用你的时间,而且你雇佣了太多的座席。这是呼叫路由可以提供帮助的地方。  呼叫路由是一种联络中心管理功能,其中传入的呼叫被放置在队列中,并根据特定条件转移(换句话说,路由)到座席或自助菜单。呼叫路由系统也被称为自动呼叫分配(ACD)。顾名思义,这些系统致力于自动分配入站呼叫。路由可以基于诸如时间、部门、语言首选项、呼叫量或呼叫复杂性等变量。  为了最有效地优化呼叫路由系统,您需要考虑传入呼叫的上下文以及各个座席的技能。通过优化的呼叫路由,您可以提高首次联络解决率(FCR)和运营的整体生产率。  呼叫的上下文  与其将所有来电尽快转接到下一个可用的座席,不如首先考虑来电背后的原因。通常情况下,你的大部分电话都可以自动化处理,并发送到自助服务,而不是使用宝贵的人力资源。  在大多数情况下,入站操作中至少有3-4种呼叫类型,可以轻松地实现自动化,而无需涉及实时座席。20-40%的入站问题通常可以通过简单地访问相关的客户信息来解决。可以轻松路由到自动自助服务的呼叫包括与包裹交付时间、帐单信息或产品和定价信息相关的呼叫。通过使用自助服务,您可以减少通话量,大大节省人力资源,确保您的座席在最需要的地方使用。  把电话转接给现场座席  当涉及到复杂的呼叫时,主要的问题是:哪个座席能够最有效地处理呼叫?根据呼叫的上下文,将呼叫路由到相应的座席时可以使用多种方法。  大多数现代呼叫路由技术都提供了基于技能的路由选择。此功能使您能够根据指定的条件将呼叫路由到特定的座席或部门。换言之,您将能够将有特定请求的呼叫者引导到具有适当技能集和培训的座席或专门处理其问题的部门。  除了基于技能的路由,您还可以选择使用路由技术创建VIP队列。呼叫路由...
  • 点击次数: 60
    2021 - 03 - 15
    去年三月,新冠疫情爆发使联络中心受到考验。他们几乎立即转变为在家工作(WFH),并面临客户服务请求的激增。一年后,尽管大多数人开始接受处理群众问题的挑战,但许多人仍在努力应对数量增长过快的询问。我现在认为,客户服务面临一个系统性的能力问题。在这个由两部分组成的系列文章中,我将解释这个挑战的含义,并引导您通过技术和组织杠杆来应对它。  容量问题  在WFH过渡的早期,主要的障碍是为座席建立远程工作环境。大多数企业都能迅速做到这一点,但并非所有企业都能做到。虽然流感大流行减少了员工流失,但也使招聘、入职和培训变得更具挑战性。大浪淘沙,留下了与客户服务需求大致相同的座席能力。与此同时,客户咨询量的急剧增加并没有停止。一开始,是关于COVID相关的问题。现在,世界变得越来越倾向于数字化,但即使是数字化进程也仍然需要人类的帮助。  数字化救援  企业已经转向自助服务和自动化,以减少人与人之间的交互。避免打电话的第一步是让客户能够在网上或手机上自助。今天最先进的网络自助服务包括可搜索的帮助中心和页面帮助。帮助中心为客户可能遇到的所有问题提供一站式解决方案,而无需浏览网站或移动应用程序。帮助中心也已经从常见问题(FAQ)演变为可搜索的文章知识库,并可以通过客户相互帮助的论坛进行扩充。  尽管网络和移动应用程序不断提高可用性,提供更多信息,但这还不够。与我交谈的企业一致认为,他们收到的咨询中有50-70%来自无法在线解决问题的沮丧客户。这些联系的主要问题是它们的上下文丢失,因为它们是匿名的,需要从头开始恢复。  企业已经部署了聊天来提供上下文帮助,但人员配置仍然是一个挑战。团队规模很小,这会造成很长的等待时间,并且很难找到所有需要的技能。机器人和会话助理可以在前端聊天,提供一些答案,并缓解反应时间差的问题。虽然这是一个很好的步骤,但只要您能够方便地访问人工,该模型就可以工作。否则,客户付出...
  • 点击次数: 87
    2021 - 03 - 08
    一个运动队从一个剧本开始工作,剧本提供了创造或应对不同环境的策略,并指导每个队员如何发挥他们的作用。同样,联络中心也有解决客户问题和机会的行动手册。随着自助服务的扩展和人工智能的引入,剧本范围需要扩大。  知识管理者  如今,联络中心的剧本中最常见的元素是脚本和知识库,这些脚本和知识库可能由主管或专门的知识管理人员建立和维护。当数据分析师将数据转化为见解时,知识管理人员收集并管理这些见解,决定如何以及在何处最好地使用它们,并建立资产,使其他人可以获得这些见解。一般资产包括:支持客户自助服务的常见问题试剂的罐装和建议响应完整的脚本,指导座席一步一步地完成交互座席搜索的知识库  随着大数据分析和虚拟座席的兴起,知识管理者的工作将发生重大变化。让我们看看其中的一些变化:人工智能现在可以增强建议和响应,以便在实时分析会话上下文的基础上,及时向座席提供建议。数据科学家将向知识管理者寻求用于分析的原始数据,以及作为机器人培训材料使用的见解库。机器人可能会扩充一些现有资产,例如可搜索的知识库,或者公司可能会决定用机器人替换资产。数据科学家将提供丰富的新见解,知识管理者可以在剩余的脚本、知识库和培训模块中部署这些见解。  随着我们的发展,知识管理者变得越来越重要。联络中心需要确保这些岗位上有合适的员工,提供所需的培训,并制定一个良好的流程,以获取知识并将其纳入行动手册,从而使其发挥作用,改善客户服务并降低成本。  教机器人说话--会话设计师  在虚拟座席的世界中,脚本不仅仅是一个会话指南,而且实际上是会话本身。一个人工座席的脚本中的内容不一定适用于机器人,因为人类在破译歧义和上下文方面要比人工智能好得多(尽管人工智能越来越好!)。健谈的设计师不仅把文字放在机器人的嘴里,而且还赋予它个性。  会话设计师需要将三个世界连接起来:问题域客户如何思考和反应机器如何“思考”和反应  他们利用自己的沟...
  • 点击次数: 111
    2021 - 03 - 01
    在今天的联络中心,员工使用来自ACD报告、质量调查和人员配置系统的统计数据来调整路由规则、建议座席辅导计划和调整员工时间表。这些员工中的许多人从联络中心的座席或主管的工作中走出来,甚至可能与联络中心的其他管理人员分担“分析”责任。然而,要想在竞争日益激烈的客户满意度游戏中取得成功,就必须采用不同的方法。  数据是新的石油--数据科学家在联络中心  “数据就是新的石油。它是有价值的,但如果未经提炼就不能真正使用。必须将数据转化为天然气、塑料、化学品等,才能创造一个有价值的实体,推动盈利活动;因此必须对数据进行分解、分析,使其具有价值。”--数据科学家先驱Clive Humby。  数据爆炸正在发生,全球数据总量每3年翻一番,站点也没有尽头。利用这些数据将推动未来的经济。这个领域的专家被称为数据科学家,《哈佛商业评论》(Harvard Business Review)称之为“21世纪最性感的工作”的职业。数据已经给职业体育带来了革命性的变化--只要看看棒球场上的击球手们用“转移”到球场的一边就知道了,这是由于击球手们的统计击球模式造成的。数据也将彻底改变联络中心。  数据通常分为两类:结构化和非结构化。结构化数据长期以来一直是联络中心管理的基础--数据是在一个组织良好的数据库中,可以交叉引用,例如由座席、组和队列组织的通话时间。非结构化数据比会话内容更原始。像聊天和电子邮件这样的数字会话有丰富的文本等待挖掘,随着语音识别技术的进步,语音会话也可以以类似的方式进行挖掘。语音和文本分析可用于破译对话并将其分类到结构化数据库中,例如,为来电者表现出挫败感或座席使用不当语言的互动建立索引。  数据科学家在新兴联络中心的工作是理解所有这些信息,并将其付诸行动以改善业务成果。  分析数据--数据分析师  数据分析师使用专门的分析工具来寻找趋势和获得见解,并帮助设计解决方案。数据分析员在结构...
Copyright ©2017 四川西沃信息技术有限公司
犀牛云提供企业云服务