百度自然语言理解UNIT-基本概念

继上一篇入门教程之后,本篇继续为大家介绍一些百度NLU平台UNIT里面的一些基本概念。


百度自然语言理解UNIT-基本概念


机器人

  • 机器人是指在一个完整对话场景下的对话能力。通常按行业垂类划分(例如:小度智能音箱中的对话场景就是一个机器人)。

技能

  • 技能是指在某一个对话场景下的对话能力(例如,小度智能音箱的点歌功能就是一个技能)。技能分为开发者自定义技能和UNIT平台预置技能。
  • 自定义技能又分为「对话技能」和「问答技能」,完全由用户配置。
  • 预置技能为UNIT平台预置的通用场景对话能力,部分预置技能目前支持添加词槽词典值来干预对话理解效果。

对话技能

  • 对话技能在多轮对话中可以准确理解用户需求(意图)和实现需求的关键信息(词槽),适用于需要根据不同对话意图和词槽信息给出不同对话答复的对话场景。能够在一些特定的对话场景下高精准地理解并满足用户需求,提升用户体验和满意度。比如问天气技能、订火车票技能、听音乐技能等等。

问答技能

  • 问答技能适用于问题问法多样,但答案相对固定的对话场景,不需要根据用户对话话语中的关键信息来设定不同的答复内容。比如针对各种规则制度、政策法规等信息的问答技能。

对话意图

  • 对话意图(intent)是对话技能要理解的用户需求(例如用户说换到中央台,那对应电视控制技能技能下的对话意图就是换台;北京天气,对话意图是查天气)。定义对话技能下的对话意图时还需要设置对话意图关联的词槽(满足对话意图的必须条件),以及技能理解对话意图后给用户的回应。

词槽

  • 是满足用户对话意图时的关键信息或限定条件,可以理解为用户需要提供的筛选条件。例如在查询天气时,词槽是地点和时间。
  • 例如:换到中央台中的中央台就是一个电视台词槽,它会一定程度上影响系统对换台这个对话意图的执行。

词典

  • 每个词槽都需要对应一套词典,技能的专名词识别服务会结合词槽绑定的词典来识别用户问话中的词槽。您可以自行导入词典,对话技能进行词槽识别时,会优先考虑自定义词典中的词汇。

对话模板

  • 对话模板是您给对话系统按具体语法、句式做出的示范,教它在某一个特定语法、句式中,该如何理解对话意图,哪个词是重要信息,对应的词槽、特征词是什么。
  • 例如: [D:sys_loc][D:sys_time]天气如何,上述标注表示可以将所有满足[城市]+[时间]+天气如何这一规则的query解析为WEATHERINFO对话意图。如北京今天天气如何?,天津明天天气如何等。
  • 其中[D:sys_loc]表示所有城市词组成的集合,“[D:sys_time]”表示所有时间描述组成的集合。
  • UNIT中一个对话模板也可以使用多个模板片段组成,支持按片段去匹配用户query,实现更强的对话意图泛化匹配能力,提高模板对用户query的召回率。

特征词

  • 特征词表示具有某一类特征的词,通常被用于约束某条对话模板的匹配范围(例如,天气,天儿等类别关键词),同时提供一定限度的泛化能力(例如订机票对话中从北京到上海的到就可以与去、飞等助词一起作为特征词);活用特征词机制可以事半功倍的提高对话模板的精度和覆盖度。

特征词词典

  • 某一类特征词的集合。

对话样本

  • 对话样本就是真实对话场景下用户表达目的的句子,教它在用户说的具体句子里,该如何理解对话意图,哪个词是重要信息,对应的词槽是什么。
  • 例如:通过对话样本标注告诉机器人“三亚明天会不会下雨”与“三亚明日会下雨吗”都是询问天气的语句,其中“三亚”是对应城市city这个词槽,“明日”和“明天”都是time词槽。
  • 这样的训练越多,机器人的理解能力便越强,这与在学习语言中的人类孩童的学习方式也是十分相似的。

对话样本集

  • 是管理对话样本的集合,类似文件夹的作用,可以把不同来源的对话样本放在不同的对话样集中,也可以把不同时间段获取的对话样本分在不同的对话样本集中。

问答对

  • 问题与答案的组合,称之为问答对。问答对支持一对一、一对多、多对一和多对多;当某一个问题对中包含多个答案时,答案随机呈现。

标签

  • 对问答对进行分类化的管理,可以打在问答技能的问答对上,可以按业务分类、问题所属业务部门等自己需要的维度来管理问答对,提高问答对的管理效率。也可以在机器人调用接口和问答技能的调用接口中传入标签信息,在特定标签范围内的问答对中匹配相似问题。

模型

  • 是您配置对话逻辑、导入训练数据后通过UNIT平台内置的各种学习引擎训练出的技能核心文件,模型需生效至沙盒环境后才可发挥作用。

沙盒环境

  • 沙盒环境是UNIT平台提供给您创建技能,训练技能模型,对话测试,调试优化技能模型的环境。每个技能都配有一个沙盒环境,将训练好的技能模型生效到沙盒环境后,就可以与技能进行对话了,同时可接入到您自己的业务系统中使用。一个技能可以训练出多个版本的模型,但只能选择一个放到沙盒环境中。

生产环境

  • 生产环境是UNIT平台在百度云上为您提供的可定制的稳定的对话服务环境。


分享到:


相關文章: