语音开发平台的现状

来源:
浏览次数: 91
   语音供应商正在探索新的途径来扩展其开发工具的使用。增强的建模精度,改进的后端集成,对其他接口的扩展以及更开放的系统是2019年的重点领域。2020年的重点是标准接口的开发和可移植性的提高。
语音开发平台的现状
  年度回顾
  在构建解决方案时,语音供应商致力于为用户提供公司应用程序的直观界面。亚马逊于6月份宣布的Alexa演示语言就是一种用于用户界面设计的工具集。它具有技能个性化功能,使开发人员可以使用Alexa应用程序捕获的语音配置文件来创建个性化技能。语音配置文件可解决首选项,记住设置并区分用户。
  改善语音识别是人们持续关注的领域。十月份,亚马逊在其Alexa技能套件中添加了三套新工具。此开发工具包可帮助公司建立自助服务应用程序。其中两个功能是'自然语言理解(NLU)评估工具'和'话语冲突检测',旨在提高语音模型的准确性。前者测试成批的话语,并将语音应用程序的自然语言处理(NLP)模型对它们的解释与期望进行比较。为了提高结果质量,NLU评估工具依赖于消费者通常说的命令,而不是由交互模型构建的样本话语。结果,系统通过识别有问题的话语来隔离训练区域。该工具还支持回归测试,允许开发人员在向语音应用添加新功能后创建并运行评估。
  NLU评估工具使用生产中的数据以匿名的高频现场话语进行测量,该数据旨在帮助调整对语音模型所做的任何更改的准确性。
  话语冲突检测功能可以检测偶然映射到多个意图的话语,这是可能会降低NLP模型准确性的一个因素。该功能会在构建每个模型时自动运行,并且可以在发布应用程序的第一个版本之前使用,也可以随着时间的推移添加意图而使用。
  除了前端开发之外,在过去几个月中,还强调了与后台业务应用程序的集成。9月,Nuance Communications扩展了Nuance智能互动平台的功能,该平台在市场营销业务流程中增加了语音功能。开发环境现在具有连接到:
  • 消息服务,以便公司可以跨多个渠道自动化和改善人工协助的客户参与度;

  • 座席AI服务,旨在为座席和主管提供相关的实时客户信息;

  • 安全和生物识别服务,以改进身份验证并防止欺诈;

  • 后端集成,因此该平台可与提供所需信息的第三方认知引擎和数据源一起使用。

  数据分析已成为第三方开发人员关注的另一个领域。亚马逊增加了一个Get Metrics API,该API与第三方数据聚合平台一起使用,允许开发人员评估各种指标,例如唯一客户。它还支持创建监视器,警报和仪表板,以突出可能影响客户参与度的更改。
  语音开发平台传统上具有不同程度的开放性。例如,苹果公司一直致力于将其系统与自己的解决方案联系在一起,这给开发人员使用替代产品带来了挑战。十月份,供应商通过允许Siri使用第三方应用程序来打开其系统。用户可以调用第三方应用程序(如WhatsApp)来代替Apple解决方案(如其自己的Messages应用程序)。但是,第三方将需要将该功能添加到其软件中。
  展望未来
  对于语音开发人员而言,可移植性一直是一项长期挑战。'语音应用程序开发人员发现,每当他们将软件从一个语音引擎转移到另一个语音引擎时,他们都必须重写软件的大部分内容,'Conversational Technologies负责人,万维网联盟多模式交互工作组主席Deborah Dahl指出。
  可移植性涉及许多问题。旧版系统旨在在数据中心的服务器上运行。许多新系统具有云优先设计。将软件从一种迁移到另一种是一项复杂的工作。Nuance的智能参与平台具有与云无关的灵活性,允许组织在Nuance的托管,公共和私有云中部署相同的解决方案。
  设备支持是另一个重点领域。Nuance全渠道解决方案高级副总裁Tony Lorentzen表示:'我们将继续看到语音成为新界面,越来越多的设备将启用语音功能。'
  然后,这些解决方案必须与传统解决方案集成。亚马逊的Alexa演示语言使开发人员可以为带有屏幕的设备(例如台式机和笔记本电脑)创建Alexa技能。
  另一个可移植性问题是将软件从一个系统迁移到另一个系统。从历史上看,市场缺乏标准接口,因此企业和第三方每次使用不同的语音引擎时都必须完成共同的工作,例如分配存储。
  十月份,Nvidia推出了Jarvis,这是一种多模式AI软件开发套件,该套件将语音,视觉和其他传感器整合到一个系统中。该工具支持用于构建,训练和部署GPU加速的人工智能系统的工作流,该系统可以结合手势和眼睛运动等视觉提示以及语音来建立上下文。
  9月,亚马逊牵头成立了语音互操作性计划小组,这是一个创建标准语音开发接口的计划。该小组设定了以下四个目标:
  • 开发与其他解决方案一起使用的语音服务,同时保护客户的隐私和安全;

  • 构建语音功能的设备,通过多个同时的唤醒词来促进选择和灵活性;

  • 发布使更容易在单个产品上集成多个语音服务的技术和解决方案;

  • 加速机器学习和对话式AI研究,以改善语音服务的广度,质量和互操作性。

  包括百度,微软,Salesforce.com和Verizon在内的30多家公司支持这项工作。苹果和谷歌是缺席者。该小组的第一批成果有望在2020年到来。
  
  作者:Paul Korzeniowski
  原文网址:https://www.speechtechmag.com/Articles/Editorial/Features/The-State-of-Speech-Developer-Platforms-139108.aspx


  • 相关资讯 More
  • 点击次数: 97
    2020 - 08 - 04
    8×8的Jeremy Watkin讨论了联络中心实时监控的最佳用途。  我不确定为什么会这样,但是当我考虑到可以实时监控联络中心座席的能力时,我通过电视看到了无休止的客户互动流,就像联络中心被实况电视转播一样。  认真地说,哪个联络中心负责人有时间和精力来监视他们的座席?  退一步,当我谈到实时监控时,是指能够收听座席的呼叫音频并查看其桌面活动的功能。  尽管许多联络中心平台都记录和保存音频和视频,但实时监控使您可以实时查看和收听活动。  而且,它通常与耳语功能配对,以便在没有客户听到的情况下与座席通话,而接驳功能则可以完全接听电话。  在本文中,我将分享8种实时监视用途,这些用途不一定类似于24小时新闻周期滚动播报,但可以使联络中心负责人从该功能中获得最大收益。  1、处理升级的互动时“先生,对不起让您有这种感觉。”“女士,如果您能冷静下来,很高兴为您提供帮助。”“如果您继续使用该语言,我将不得不结束此通话。”  或者,您可能已经被告知在群聊中很难进行互动,并且想听听或了解一下客户在说什么。  在加入或接管交互之前进行实时监视并获得一些背景信息,可以帮助您作为主管来使客户平静下来,并更快地制定出解决问题的方案。  2、当客户需要挽留时  有时,当客户互动变得激烈时,您将冒着完全失去客户的风险。  使用耳语功能来指导座席达到最佳解决方案可以帮助扭转整个交互过程,并采取措施恢复客户对公司的信心。  3、监视新座席时  您如何看待一位父母为3岁的孩子购买了第一辆自行车,向他们展示了如何骑自行车的30分钟教学视频,然后期望他们的孩子在没有训练的情况下完美骑行?那是愚蠢的,对吧?  同样,实时监视使新座席在与客户进行首次交互时变得更加容易。这可以在任何地方进行,无论是在联络中心还是在世界各地。  4、当新座席与经验丰富的座席一起工作时  座席完成培训时的一种常见做法是让他...
  • 点击次数: 84
    2020 - 07 - 27
    Akixi的希拉里(Hilary)解释了电信行业面临的挑战。  就像新数字化世界中的所有其他部门一样,电信业正处于重大转型之中。我们交流的方式正在发展,以适应需要更大敏捷性,机会和灵活性的环境。  在新的十年的第一年2020年,环境充斥着混乱,电信行业的变化无处不在。  人工智能(AI)现在已成为日常交流的标准,补充并增强了客户与品牌之间的讨论。  5G技术正在发展,为丰富的移动体验铺平了道路。由于这些独特市场的大幅增长,对新网络服务的需求也出现了前所未有的增长。  根据《安永数字化转型》(2020年及以后)报告,电信公司面临的最大挑战是技术,服务管理和其他领域的供应商的破坏性竞争。  那么,通信公司今后还需要克服哪些其他重要问题?  让我们来看看。  对传统服务的需求正在减少  尽管物联网(IoT)和5G已开始推动供应商产品提供更多的多样性,但使用旧版工具的企业仍在努力保持领先地位。  所有环境中的供应商都需要扩展他们的产品范围,超越语音基础,以提供从SMS到视频的所有内容。  人们交流的方式正在改变。互联网消息传递,VoIP和其他基于云的技术正在占领整个行业。甚至智能手机流量也正在转移到WiFi。  这意味着各种规模的企业都需要考虑如何发展其服务包以适应以云为中心的新社区。  公司不仅需要提供下一代的联络中心产品以保持领先地位,而且还需要确保这些新服务可靠且实用。  客户越来越不接受质量和性能下降的问题。  如果通信公司要蓬勃发展,那么实时监视数据和检查呼叫流量质量的能力将至关重要。通信服务需要比以往任何时候都更快,更敏捷,更可靠。  安全性和数据泄露风险  监视呼叫和通信质量对于确保客户获得应有的那种电信体验至关重要。  但是,出于另一个原因--数据和隐私,跟踪和了解您的通信生命周期对于电信公司也至关重要。  对于电信公司而言,将数据安全性和隐私性作为主要重点已变得越...
  • 点击次数: 100
    2020 - 07 - 20
    突然需要“远程”,影响了公司运营的各个方面,客户服务也是如此。一些公司很幸运,已经部署了使联络中心团队能够远程工作并因此保持客户习惯的支持水平的技术。其他人则没有那么幸运,他们需要关闭某些(有时只是暂时的)客户服务渠道,因为他们不能通过远程团队适当地支持他们。我们还听到了一些案例,这些案例是公司试图通过新的安全协议使客户服务办公室保持开放状态,以便为客户提供服务。这无疑会降低生产率,并可能使团队面临风险。  随着各国开始考虑开放并试图恢复到“正常”状态,毫无疑问,企业将在考虑是否以及如何将远程和灵活的工作仍然作为联络中心运营的一部分。长期如何运作?他们如何运营?  客户服务悖论  客户服务团队一直在努力拥抱新的数字渠道,例如消息传递应用程序,实时聊天,聊天机器人和社交媒体渠道,以与客户进行沟通。但是,客户服务团队通常不具备从任意位置通过各种渠道随意参与的相同灵活性。使用本地软件,它们通常与固定的联络中心位置保持联系。洪水,旅行中断和大流行控制措施等事件使固定运营的公司更难以满足其客户和员工的需求。  灵活工作给员工带来的好处已经有几十年了,但是目前对组织和客户的运营好处还不那么明显。  客户正在努力联系客户服务座席,这可能是因为团队已被派往家中,或者是座席无法在不访问他们通常依赖的本地系统的情况下与客户进行远程连接。已经使用云技术的具有远见的组织可以通过从任何地方通过浏览器访问的软件来远程运营其联络中心。为了利用这种灵活性并更好地远程管理查询,自2020年3月以来,我们已经看到许多公司将其电话座席转移到数字化渠道上来。  客户服务运营的未来  未来,组织中的客户服务将通过每个部门对云和远程工作如何帮助他们更好地开展业务的方式进行重新思考。云已经彻底改变了企业共享文件,团队内部通信,管理供应链,管理营销等方式。将其与灵活的远程工作策略相结合,将使客户服务部门足够敏捷以应对任何...
  • 点击次数: 96
    2020 - 07 - 13
    人工智能(AI)作为客户服务技术(包括启用语音的技术)中的嵌入式功能正变得越来越普遍。  公司每年使用AI来处理数十亿的客户通信。AI系统可以响应最常见和最简单的查询,例如“我的帐户余额是多少”,从而使人工座席可以自由处理更复杂的客户服务问题。AI系统的设计不仅可以理解客户的查询,还可以确定最佳的响应方式,这是否意味着提供直接答案,提出明确的问题,将交互传递给现场座席,下订单或其他。  对系统进行编程以做出这些决定并采取这些行动绝非易事,而且要承担与承担该任务的人员相同的失败。因此,偏见可能会渗入算法,特别是因为AI仅与输入的训练数据一样好,并且该数据可能包括关于性别,种族,性取向或其他历史或社会不平等因素。  在许多公司正在扩大对AI的使用的时候,意识到这些偏见并缓解它们是当务之急。  “这是一个重要的问题,因为我们正在做出越来越重要的AI决策,”Spark Beyond的首席执行官兼联合创始人Sagie Davidovich说。Spark Beyond是使用AI的自动化研究引擎的提供商。“您要有责任心,透明性和包容性。”  “发现AI语音识别系统包含歧视特定人群的偏见。”Pro Privacy.com的数字隐私专家Ray Walsh说:“这令人不安,因为这类算法通常部署在所有公民使用的平台上。结果,这些技术可能积极地导致偏见或歧视的重新表达。”  如果不加发现,人工智能的偏见可能导致有害的歧视性做法,竞选结果失真,违反法规或失去公众信任。  没有比在2016年失败的Microsoft Twitter机器人Tay失败命运更明显的事实了。Microsoft将Tay描述为一种对话理解的实验,其中Tay参与度越高,越聪明,它就会通过“随意而有趣的对话。”  但是,一旦Tay上线,人们就开始在Twitter上发布推文,其中包括各种厌恶种族主义言论。Tay开始向用户重复这些种族主义...
Copyright ©2017 四川西沃信息技术有限公司
犀牛云提供企业云服务