语音引擎的现状

来源:
浏览次数: 102
   在2019年,语音引擎变得更加复杂,现在能够支持其他语言和方言,但也还有更多工作要做。这些解决方案,包括语音到文本,文本到语音,语音识别,语音命令和控制,语音搜索,转录,翻译以及相关活动的技术,现在在识别单词方面做得更好,但具有讽刺意味的是,这种能力并不是用户最终想要的。相反,他们需要可以像人一样对它们做出反应的系统。但是,对于供应商而言,实现该目标仍然遥遥无期。
语音引擎的现状
  年度回顾
  在2019年添加的新语言和方言中,亚马逊的Alexa现在支持印地语语音交互。此外,该供应商还增强了系统以了解当地流行语言的变体,例如美国西班牙语和巴西葡萄牙语,从而使更多的消费者可以查看天气,控制智能家居设备以及使用亚马逊品牌的设备听音乐。Bose,LG电子和索尼等第三方访问Alexa语音服务应用程序编程接口(API)来开发Alexa Skills。
  LumenVox还扩展了其系统的支持范围,以支持本地方言,例如美国,英国澳大利亚人,新西兰英语和北美西班牙语。
  而且由于许多个人和家庭说多种语言,因此Amazon Web Services进一步引入了多语言模式,该模式允许Alexa在两种语言之间切换。该系统通过识别用户说出的语音并以相同的语言进行响应来自动进行调整。此功能分为三对可用:美国的英语和西班牙语,印度的印度英语和北印度语以及加拿大的英语和法语。
  LumenVox客户服务副总裁Jeff Hopper表示,与此类似,LumenVox还添加了一个新的转录引擎,专门针对无音频格式。他解释说:“它可以实时工作,因此[交互式语音响应(IVR)]应用程序不仅可以接收结构化数据或自然语言输入,还可以处理原始文本。”
  但是,对于整个语音行业来说,更有意义的是人工智能(AI)和深度神经网络正在开展的工作。人工智能工作已迅速进入主流语音技术,允许更多自然语言,对话交互,并且随着引擎处理越来越多的语音,机器学习使系统的准确性和性能得以提高。
  今年,第四代深度神经网络(DNN)的出现也显示了语音引擎的进步。它们在输入和输出之间具有多层,因此可以使用线性或非线性关系得出结论。
  Nuance Communications是该领域的领导者,该公司在7月推出了Nuance Lightning Engine,这是一种DNN,结合了语音生物识别技术和自然语言理解,可以跨语音渠道提供个性化,人性化的体验。
  展望未来
  尽管语音引擎已在许多方面得到了改进,但基础技术仍存在很多缺点。根据Booz,Allen&Hamilton的前专业人士StephenArnold的说法,当今的系统在识别单个单词方面明显要好得多,但需要的是能够在上下文中理解单词的解决方案。
  由于此限制,当将语音系统部署为企业和消费者使用时,它们有时无法正常运行。用户专注于最终结果,例如从语音搜索中获取结果,但是系统通常无法提供所需的理解水平。因此,根据普华永道最近的一项调查,有71%的美国人更愿意与人互动,而不是聊天机器人或其他自动化过程。
  供应商正在完善他们的系统以弥合这一差距。Google开发了BERT(来自“变形金刚”的双向编码器表示),这是一种语音识别解决方案,旨在连接单词和更好地理解句子上下文。例如,如果某人正在寻找有关在另一个国家旅行的信息,则BERT会认识到“去(to)”一词比“来自(from)”更重要。
  类似地,Translate Your World一直在构建语音解决方案,以识别对话中的语气,并且供应商发现,各个人的语气会因情况而异。“最终目标是指导AI翻译,以便它们在对话的背景下为与个人打交道提供正确的模式,”该公司总裁SueReager解释说。例如,“shingles”一词通常是指房屋屋顶上的物品,但在医疗保健领域,它代表病毒感染。
  同样,交流因群体而异。“我们发现,消费者通常不会像企业高管那样讲的很清楚。”Reager补充说:“消费者的发音有时不清楚,他们通常不使用完整的句子。他们的思想缺乏组织,因此有时很难找到固定的模式。”
  培训语音引擎以识别和适当地应对此类差异是她的公司以及其他多个行业细分领域将在2020年解决的问题。
  谁来承担当前的语音挑战一直在变化。“试图翻译语音变得越来越困难,而且非常昂贵,”Arnold坚持认为。“在过去的日子里,麻省理工学院机器学习实验室的一些人能够建立一个商业系统。但是不做了。”
  如今,语音引擎的研究需要大量资金,高技能的数据科学家和庞大的数据中心,而这些数据中心将拥有巨大的计算处理能力。因此,谷歌,亚马逊网络服务,微软和IBM等国内行业巨头正在承担许多工作。
  在国际上,中国公司,例如百度,也在挑战这些问题。根据Arnold的说法,中国供应商之所以处于有利地位,是因为它们不受传统技术的束缚,可以采用新的方法来解决这些长期存在的问题。
  供应商在扩展其产品功能方面也取得了进展,因此他们支持更多类型的语音,但是仍需要努力以帮助该技术将单个单词置于上下文中,以便系统可以适当地响应。随着市场的变化,开发负担急剧增加。展望未来,似乎只有财大气粗的行业巨头才能拥有推动语音解决方案前进所需的资源,从而变得更加人性化。

  作者:Paul Korzeniowski
  原文网址:https://www.speechtechmag.com/Articles/Editorial/Features/The-State-of-Speech-Engines-139107.aspx


  • 相关资讯 More
  • 点击次数: 105
    2021 - 07 - 26
    我们现在生活在这样一个世界:人工智能(AI)了解人们的情绪和情感,因此做出明智和数据驱动的决策,目的是通过个性化提高客户参与度。  个性化始于同理心。要实现这一目标,超个性化企业必须首先了解客户的行为和意图,然后以情感上适合具体情况的方式进行先发制人和主动干预。在这样做时,面向客户的员工必须缓解问题,并根据客户的行为和兴趣提供个性化的服务或信息。  然而,个性化的努力往往缺乏同情心,这在以情感方式与客户联系时至关重要。当企业通过理解客户对他们的行为和沟通方式的感受和原因,将同理心融入到他们的工作中时,它将有助于为更大的个性化开辟道路。  这种更高层次的个性化源自捕捉和倾听客户反馈。创造这种以人为中心的人工智能交互,优化人工智能和人类之间的关系,增强人类的同理心,将为促进同理心驱动的客户参与提供更大的机会。  人工智能增强了人类的参与  当我想到联络中心或客户服务中的同理心时,我立刻想到21世纪初出现的Zappos在线服装零售商,它是第一家围绕同理心和倾听客户意见建立服务组织的公司之一。当客户联系Zappos的联络中心时,当时的座席并不依赖于脚本式的对话,也没有试图推销。这在很大程度上是由于在线零售商没有通过平均呼叫处理时间来衡量他们的表现。取而代之的是,座席的表现是通过他们对客户的超越程度,以及他们解决客户问题的速度来衡量的;类似于当前客户努力程度得分的指标。整个模型围绕着与客户建立情感联系。  也许人工智能不能取代人类的同理心,但它可以帮助增强人类的参与度,以帮助座席变得更具同理心,从而像Zappos的座席所展示的那样,提供情感上相关的参与。这个模型涉及到采用以人为中心的人工智能方法,将一些复杂的理解放在技术的肩膀上,同时向人类提供情感和认知输入。以人为中心的人工智能通过让座席通过以下三种方式分配同理心参与,架起模拟同理心和人类同理心之间的桥梁:接受积极主动的指导性辅导洞...
  • 点击次数: 130
    2021 - 07 - 19
    社交媒体和评论网站的发展使得消费者越来越多地通过各种在线渠道分享他们对品牌的看法以及对产品和服务的批评。因此,组织必须了解社交媒体用户对其品牌的看法,才能了解人们对品牌的看法和感受。  这就是情绪分析可以提供帮助的地方。  情绪分析到底是什么?  情绪分析将自然语言处理(NLP)与人工智能(AI)和机器学习相结合。它是语音分析或文本挖掘概念的一部分,从社交媒体帖子、产品评论、调查和新闻文章等文本中提取意义,然后分配积极或消极的情绪分数。  这些技术的结合使得情绪分析工具能够更好地理解语言和人们的真实观点。这允许您确定客户对产品、服务或主题的态度是消极的、中立的还是积极的。因此,情绪分析通常用于理解:情绪极性,评估人们对你品牌的看法是积极的还是消极的情绪强度,监控他们的情绪强度  情绪分析对于节省时间和增加社交媒体倾听、调查响应分析、员工反馈处理和竞争对手研究等过程的价值至关重要。在实践中,这有助于加强诸如市场调查、市场分析、产品设计、公共关系、金融交易和声誉管理等活动。  利用情绪分析提高客户满意度  通过情绪分析,您可以分析信息,了解数字助理、电子邮件、社交媒体帖子和文本对话中书面内容的态度、情绪和语气。然后,您可以利用这种洞察力来真正理解人们说了什么以及他们是如何说的,提高他们对您的品牌和产品的认知,并使客户体验人性化。  部署情绪分析的好处包括:  1、情感分类  情绪分析使您能够处理更准确的数据。例如,NLP使用lemmatization,它将一个词的不同形式进行整理,以分析各种复数和时态,并识别诸如形容词、名词和动词等言语要素。  因此,您可以对用户评论和客户反馈建立更可靠的分析。然后你可以开始对他们的情绪进行分类,这样你就可以了解客户对你的员工、数字和实体店、政策、产品、服务和网站的感受。  2、潜在问题识别  不满意的客户越来越多地转向社交媒体来表达他们对品牌...
  • 点击次数: 108
    2021 - 07 - 12
    联络中心座席是您组织的第一线。然而,他们的工作压力很大。座席经常被要求帮助那些可能生气或不安的客户,他们必须以专业精神、同情心和同理心做出反应。他们的工作往往单调而有压力,需要持续监控,以确保他们尽可能快速高效地解决客户的问题。再加上在家工作可能造成的孤立,压力水平会进一步攀升。   考虑到这一点,不仅照顾座席的身心健康是道德上的当务之急,而且对商业也有好处。快乐、积极的座席更有效率,不太可能请病假或找其他工作。最重要的是,他们更有可能提供更好的服务,满足那些更加忠诚并可能花费更多的客户。  从本质上讲,专注于您的座席有三个业务好处:  1、增加员工留任  员工留用问题多年来一直困扰着联络中心部门。根据Contact Babel research的数据,2020年该行业的平均员工流失率为20%。这种流行病只会使这一趋势更加恶化--Enghouse Interactive的一项研究发现,91%的座席可能会在2021年更换工作。如果你想避免自己的联络中心出现高员工流失率,寻找工作压力的解药,确保员工快乐、满意和积极性应该是一个重要的优先事项。留住你的员工意味着你也降低了成本--你不必花钱去寻找、雇用和培训那些需要时间才能跟上进度的新员工。病假减少了,生产力也提高了。  2、提供更好的客户服务  如果士气高涨,座席感到满意,那么他们更有可能从事自己的工作,并提供更好的服务。长期以来,这种情况一直存在,但随着日常客户服务查询现在越来越多地通过自助服务和聊天机器人进行处理,座席更有可能将时间花在支持客户处理更复杂、更难解决的问题上。这使得他们在提供确保客户对您的品牌保持忠诚的体验方面更加重要。  3、雇主品牌  确保你有一个理解雇主的声誉,提倡积极的支持性工作环境可以帮助任何企业吸引和留住人才。而在联络中心行业,面对座席面临的压力和人才竞争,这一点可能更为重要。建...
  • 点击次数: 95
    2021 - 07 - 05
    客户满意是企业所追求的核心目标,它几乎决定了企业的市场占有、利润和生命力。对于那些追求基业长青的企业来说客户满意更是唯一的依靠,因为任何产品设计、市场营销、广告推广甚至具体的服务项目都经不起时间的锤炼,只有客户心理的认可才能使企业获得客户长久的支持。  对客服中心来说“以客户为中心”不仅仅是口号,更要将获取更多的客户满意定为核心目标并且实际落实在所有的管理工作中。  客服中心要分析客户的需求再对应不同的需求采取措施,使客服中心所提供的服务与之匹配,最终满足客户需求,获取客户满意。  充分认识客户需求  马斯洛需求层次理论告诉我们人类的需求是有层次划分的,它既体现个性,但更多时候会展现共性的特点。  对于客服中心来说它服务的客户群有较大的数量级,其单位服务成本并不高,更多是依赖高度信息化的工具,提供给客户标准化、规范化且有效率的服务。客服中心应主要研究客户的共性需求部分,至于个性部分则要提高到客户关系管理的层级,需要依赖更加信息化、智能化的管理体系。本文仅研究客户的共性需求部分,这也是客服中心的主要职责所在。  著名的质量管理大师狩野纪昭教授的KANO模型理念非常适合于分析客服中心的客户群,它将客户需求分为三个层级:  基本型需求:客户认为企业“必须提供”的产品属性、功能或服务,当其特性不充足(不满足客户需求)时客户很不满意甚至愤怒;当其特性充足时无所谓满意不满意,充其量是没有抱怨。  期望型需求:客户希望企业“能够提供”的更多的产品属性、功能或服务,但不是底线。客户最愿意谈论也最重视这部分需求,当其特性不充足时客户不满意;当其特性充足时客户满意,且越充足客户越满意。  兴奋型需求:企业“额外提供”给客户的产品属性、功能或服务,是完全出乎客户意料的、能够带给客户惊喜的。当其没有特性表现时客户无所谓;当其有特性表现时哪怕仅有一点,客户就非常满意,而且很容易将满意转化为忠诚。  ...
Copyright ©2017 四川西沃信息技术有限公司
犀牛云提供企业云服务