语音引擎的现状

来源:
浏览次数: 102
   在2019年,语音引擎变得更加复杂,现在能够支持其他语言和方言,但也还有更多工作要做。这些解决方案,包括语音到文本,文本到语音,语音识别,语音命令和控制,语音搜索,转录,翻译以及相关活动的技术,现在在识别单词方面做得更好,但具有讽刺意味的是,这种能力并不是用户最终想要的。相反,他们需要可以像人一样对它们做出反应的系统。但是,对于供应商而言,实现该目标仍然遥遥无期。
语音引擎的现状
  年度回顾
  在2019年添加的新语言和方言中,亚马逊的Alexa现在支持印地语语音交互。此外,该供应商还增强了系统以了解当地流行语言的变体,例如美国西班牙语和巴西葡萄牙语,从而使更多的消费者可以查看天气,控制智能家居设备以及使用亚马逊品牌的设备听音乐。Bose,LG电子和索尼等第三方访问Alexa语音服务应用程序编程接口(API)来开发Alexa Skills。
  LumenVox还扩展了其系统的支持范围,以支持本地方言,例如美国,英国澳大利亚人,新西兰英语和北美西班牙语。
  而且由于许多个人和家庭说多种语言,因此Amazon Web Services进一步引入了多语言模式,该模式允许Alexa在两种语言之间切换。该系统通过识别用户说出的语音并以相同的语言进行响应来自动进行调整。此功能分为三对可用:美国的英语和西班牙语,印度的印度英语和北印度语以及加拿大的英语和法语。
  LumenVox客户服务副总裁Jeff Hopper表示,与此类似,LumenVox还添加了一个新的转录引擎,专门针对无音频格式。他解释说:“它可以实时工作,因此[交互式语音响应(IVR)]应用程序不仅可以接收结构化数据或自然语言输入,还可以处理原始文本。”
  但是,对于整个语音行业来说,更有意义的是人工智能(AI)和深度神经网络正在开展的工作。人工智能工作已迅速进入主流语音技术,允许更多自然语言,对话交互,并且随着引擎处理越来越多的语音,机器学习使系统的准确性和性能得以提高。
  今年,第四代深度神经网络(DNN)的出现也显示了语音引擎的进步。它们在输入和输出之间具有多层,因此可以使用线性或非线性关系得出结论。
  Nuance Communications是该领域的领导者,该公司在7月推出了Nuance Lightning Engine,这是一种DNN,结合了语音生物识别技术和自然语言理解,可以跨语音渠道提供个性化,人性化的体验。
  展望未来
  尽管语音引擎已在许多方面得到了改进,但基础技术仍存在很多缺点。根据Booz,Allen&Hamilton的前专业人士StephenArnold的说法,当今的系统在识别单个单词方面明显要好得多,但需要的是能够在上下文中理解单词的解决方案。
  由于此限制,当将语音系统部署为企业和消费者使用时,它们有时无法正常运行。用户专注于最终结果,例如从语音搜索中获取结果,但是系统通常无法提供所需的理解水平。因此,根据普华永道最近的一项调查,有71%的美国人更愿意与人互动,而不是聊天机器人或其他自动化过程。
  供应商正在完善他们的系统以弥合这一差距。Google开发了BERT(来自“变形金刚”的双向编码器表示),这是一种语音识别解决方案,旨在连接单词和更好地理解句子上下文。例如,如果某人正在寻找有关在另一个国家旅行的信息,则BERT会认识到“去(to)”一词比“来自(from)”更重要。
  类似地,Translate Your World一直在构建语音解决方案,以识别对话中的语气,并且供应商发现,各个人的语气会因情况而异。“最终目标是指导AI翻译,以便它们在对话的背景下为与个人打交道提供正确的模式,”该公司总裁SueReager解释说。例如,“shingles”一词通常是指房屋屋顶上的物品,但在医疗保健领域,它代表病毒感染。
  同样,交流因群体而异。“我们发现,消费者通常不会像企业高管那样讲的很清楚。”Reager补充说:“消费者的发音有时不清楚,他们通常不使用完整的句子。他们的思想缺乏组织,因此有时很难找到固定的模式。”
  培训语音引擎以识别和适当地应对此类差异是她的公司以及其他多个行业细分领域将在2020年解决的问题。
  谁来承担当前的语音挑战一直在变化。“试图翻译语音变得越来越困难,而且非常昂贵,”Arnold坚持认为。“在过去的日子里,麻省理工学院机器学习实验室的一些人能够建立一个商业系统。但是不做了。”
  如今,语音引擎的研究需要大量资金,高技能的数据科学家和庞大的数据中心,而这些数据中心将拥有巨大的计算处理能力。因此,谷歌,亚马逊网络服务,微软和IBM等国内行业巨头正在承担许多工作。
  在国际上,中国公司,例如百度,也在挑战这些问题。根据Arnold的说法,中国供应商之所以处于有利地位,是因为它们不受传统技术的束缚,可以采用新的方法来解决这些长期存在的问题。
  供应商在扩展其产品功能方面也取得了进展,因此他们支持更多类型的语音,但是仍需要努力以帮助该技术将单个单词置于上下文中,以便系统可以适当地响应。随着市场的变化,开发负担急剧增加。展望未来,似乎只有财大气粗的行业巨头才能拥有推动语音解决方案前进所需的资源,从而变得更加人性化。

  作者:Paul Korzeniowski
  原文网址:https://www.speechtechmag.com/Articles/Editorial/Features/The-State-of-Speech-Engines-139107.aspx


  • 相关资讯 More
  • 点击次数: 143
    2020 - 12 - 28
    21、质量保证(QA)将越来越自动化  虽然联络中心在衡量电话互动的质量和服务指标方面非常出色,但它们在数字渠道上难以达到同样的可见性和服务质量。  2021年,联络中心将需要投资于提供客户旅程端到端视图的工具,识别摩擦点、服务质量和团队绩效问题。  随着远程工作的增加,许多手工的质量保证方法变得更加棘手,联络中心需要自动发现“可指导的时刻”。  感谢Clarabridge的Shorit Ghosh  22、语音质量将推动客户体验  许多组织已经失去了向客户提供当面服务的能力。因此,联络中心现在成为品牌与客户沟通的主要渠道。  语音使品牌能够与客户建立以人为本的联系,用有意义的、高价值的电话取代原本面对面的交流。在需要友好的声音和富有同情心的耳朵的复杂情况下,这一点尤其重要。  声音质量是创造最佳通话体验的关键,而耳机的选择对于提高满意度至关重要。  像PolyEncorePro这样的耳机具有内置的噪音消除功能,这意味着不需要的背景噪音可以被屏蔽,座席可以完全专注于互动。  2021年,品牌将把声音放在客户体验的核心,提供更好的服务,获得忠诚度,留住有价值的客户,这将是关键。  感谢Poly的Richard Kenny  23、数字技术最终取代了  通过电话联系公司可能很困难,而且由于缺乏人手而导致的等待时间过长等问题并不少见。  因此,许多客户开始转向非电话通信方式,而公司自己也发现这更容易实施服务。  这导致了一场完美风暴:功能日益强大且易于使用的内置全渠道云联络中心服务,希望将IT战略转向云的公司,以及希望跨多个渠道提供一致服务的客户。  因此,2021年将是以全渠道云联络中心的形式真正起飞的一年。  感谢IPIntegration的Craig Farley  24、关注员工福利的企业会增加  甚至在COVID-19流感大流行席卷我们的生活之前,我们就已经开始看到对员...
  • 点击次数: 105
    2020 - 12 - 14
    11、视频,视频和更多视频  2021年很可能延续今年的主题,视频将在联络中心得到更广泛的应用。  我们预计将有多种视频应用,包括员工培训和远程团队会议,以及用于健康和福利的目的,当然还有客户参与。  在后一种情况下,这可能包括从零售商展示特定产品的好处到现场工程师解释如何修复破裂的水龙头,或是医生进行病人咨询。  解释性视频也可以发布在公司网站或社交媒体平台上,通过在线提供视频解答帮助客户解决常见问题,有助于减少给企业内部技术专家的来电。  12、云迁移将继续激增  我们将看到2021年继续向基于云的平台和基础设施转变。  联络中心已经虚拟化,明年将继续朝这个方向发展。  许多企业现在已经承认,员工在书房、卧室或餐桌上工作是一种新的常态,至少在短期内是这样。  谷歌表示,其员工将在家工作至少到2021年夏天,微软也允许更多员工永久在家工作。  可以预测,许多组织,包括联络中心,将更多地转向混合工作模式,鼓励工作人员远程工作,并有机会将办公室用作协作和会议场所。  在联络中心的背景下,这种方法既有云技术的支持,也有互联企业的概念,在这种情况下,IT、谈判和社交媒体方面的专家(仅举三个例子,还有其他很多),可以在需要时加入到对话中。  感谢Enghouse Interactive的Jeremy Payne  13、其他部门开始看到联络中心的价值  尽管联络中心被许多人视为“成本中心”,但COVID-19的爆发强调了它们对企业的价值。  联络中心是一个强大的资源,可以用来了解客户对公司的看法、他们最重要的愿望/顾虑,并捕捉客户的情绪。  为了获得更好的见解,我们希望能够给联络中心额外的预算,以获得更好的见解,包括:分析云解决方案共同浏览现场参与全渠道通信回忆技术,也称为“再想技术--OST”社交媒体参与员工参与工具  回忆技术是一个特别有趣的例子,因为它也有助于联络中心保持每次...
  • 点击次数: 134
    2020 - 12 - 07
    callcentrehelper的专家小组分享了他们对2021年联络中心行业将如何变化和发展的预测。  1、COVID-19将继续改变一切  雇佣了成百上千名座席的联络中心有很高的暴露于冠状病毒的风险,这就是为什么大多数中心不会恢复正常运作的原因。  然而,转向远程工作让许多人看到了家庭工作的好处--在灵活性、幸福感和生产力方面--大多数联络中心计划采用混合式联络中心模式。这项调查来自于CallCentreHelper网络研讨会:未来联络中心  这些统计数字表明,联络中心不太可能回到传统的做事方式,但也不会完全偏离。大多数人会寻求两者的最佳平衡。  2、你的数据不会像以前那样安全了  2019年,仅美国就发生了1506起数据泄露事件,每次平均损失390万美元。事实上,22%的违规案例都与网络钓鱼有关。  勒索软件攻击也越来越普遍。令人担忧的是,这些安全事件发生在大流行之前,而在家工作的安排增加了这种脆弱性。  如果你的联络中心不向远程座席培训最新的黑客和网络钓鱼花招,那只会招致灾难。  此外,系统管理员需要掌握各种应用程序,限制远程座席安装未经授权的软件,并更新到最新的安全措施。  3、对社交媒体的依赖将会增加  如果社交媒体无处不在,那么一个品牌对于它的追随者来说就必须无处不在。按照这个逻辑,联络中心对社交媒体的依赖将在2021年继续增加。  无论您的设施是使用聊天机器人或人工座席与消费者互动,您的社交媒体的使用应表现出在解决问题方面的响应能力和关心程度,并公开双向对话,向其他客户展示问题是如何解决的。  这样的互动可以提高客户体验和可信度,两者都是黄金。  尚未准备好使用生物识别方法的联络中心也可能更多地利用社交媒体认证作为确认客户身份的权宜之计。  感谢Voci技术公司的Yasir Bugrara  4、联络中心需要克服远程工作的挑战  随着家庭工作日益成为联络中心生...
  • 点击次数: 102
    2020 - 11 - 30
    在笔者的上一篇文章中谈到了千禧一代和Z一代的技术和通信偏好如何要求客户服务超越全渠道。这正是我们需要做的,以赶上现代消费者的行为和期望。想要真正实现差异化和在体验上竞争的公司必须保持领先地位--以及消费者。  有鉴于此,以下是我们在UJET看到的五种趋势,它们将在未来几年内塑造客户体验(CX)。  嵌入式体验  无论是通过电话、短信还是应用程序App,如今消费者主要通过智能手机与品牌建立联系。因此,我们看到了对嵌入式体验的巨大需求,这种体验融合了数字和语音以及营销、销售和支持的渠道和通信模式,以获得更统一的品牌体验。  这反过来又使联络中心的领导越来越多地询问智能手机的生物特征识别、实时多媒体共享和现代身份验证方法,如人脸识别、指纹验证和模式识别。  拥抱远程客户  2020年最大的全球主题和挑战之一是远程工作,因为全球流行病迫使企业加快劳动力分散,包括联络中心管理员、主管和座席。  随着企业开始清理和更新他们长期以来的数字化转型要求,他们不仅意识到CX现在是他们战略的核心,而且他们远程工作人员所需的技术长期以来一直是远程客户的主流。现在,随着这一突然的更新周期,企业正迅速接受以数字为先、以移动为中心的消费者,并进行重大投资,以迎合他们的现代生活方式。  CX推动数字化成熟  消费者行为一直走在企业技术创新的前面,也因此成为企业技术创新的动力。但是,虽然销售和营销部门在研发方面投入了大量资金,但联络中心却远远落后。这是因为,虽然我们都在谈论以客户为中心的理念,但我们仍然会优先考虑座席、部门和企业的需求。如果我们要以客户为中心,我们必须(最终)把客户的需求放在首位。  2020年的挑战将实现这一目标推向了前沿,因此,CX从企业高管那里获得了实质性的、实际的关注和优先顺序。  我们听到的“数字化转型”比以往任何时候都多,但最能说明问题的是,与业务的其他领域相比,联络中心和CX的...
Copyright ©2017 四川西沃信息技术有限公司
犀牛云提供企业云服务