开发者学堂课程【3节课走进云小蜜产品:课时3 :高级能力和算法效果优化】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/298/detail/3497
课时3 :高级能力和算法效果优化(一)
内容介绍:
一、简介
二、演示系统内置意图以及内置实体的使用方法
三、意图话术高级配置方式 LGF
四、机器人训练流程
五、总结
一、简介
本课程的主要内容是高级能力与算法效果优化,主要目标是给用户提供针对机器人效果优化的抓手。让用户了解并掌握机器人效果优化的常用的流程以及手段,帮助用户将机器人的自然语言理解水平包括实体识别,意图识别等做到90%以上,达到业务可交付的效果。
本次课程大纲如下:
1.系统内置意图、实体
2.意图话术高级配置方式 LGF
3.机器人训练
数据筛选标注
小样本意图识别
大样本意图识别
第一部分是系统内置意图和实体,为了最大程度的减少用户对话构建的成本,所以离线做了挖掘和沉淀,把通用的常用的意图和实体,进行了内置,并且保证内置的意图实体效果能够,达到好的水平,
第二部分是意图话术高级配置方式 lgf,该配置方式主要解决的问题是在对话启动以及干预时,如果仅仅只能一条一条话术配置,配置效率较低,所以采用 LGF 的方式,配置单条,效果能够达到上百条或是更多话术的效果,能够节省配置成本。
第三部分是机器人训练,为了更好地保障机器人的理解水平,引入了机器学习算法。机器学习算法需要大量标注数据让模型进行学习,模型如果没有数据就无法进行学习,所以第一部分介绍数据筛选和标注。针对数据标注量的数量,如果每条意图只标注十条,该情况下较为适合使用系统内置的意图识别模型,但如果意图标注量本量较多,达到了百级别或更多,就可以直接训练大样本的监督学习模型,意图识别会更加好。对于系统内置的意图和实体,目前系统内置了19种通用的意图:停止、取消、感谢、返回、重听、上一个、下一个、你是谁、转人工、信号不好、友好问候、寻求帮助、通用否定、通用肯定、客户不方便、客户说再见、骂人说脏话、质疑是机器人、客户反问什么事。内置通用意图有19个,模型F1=91.96%,内置实体方面沉淀了包括时间,地点,数字,医疗,生活,文娱及其他方面七大类。内部包括一百多个小类:
实体类别 |
数量 |
主要类别 |
示例 |
时间类 |
7 |
日期、时间、周期时间、持续时间等 |
2020年6月18号下午5点进行了三个小时的会议 |
地点类 |
28 |
国家、行政区划、POI系列等 |
我老家是山东省烟台市 我住在千鹤家园小区 |
数字类 |
22 |
各类数字、各类数量词、车牌、电话号等 |
工作完成了三分之一 车牌号是京 N98U6 |
医疗类 |
16 |
疾病、症状、检查、药品、诊断、用药频率等 |
老王患有糖尿病 我今天体温正常 这个药每天三次 |
生活类 |
8 |
快递相关、菜谱、食材等 |
帮我发顺丰快递 我要点一个西红柿炒鸡蛋 |
文娱类 |
3 |
人物名、电影和广播电台 |
是张艺谋拍的闪闪的红星吗 我要听央广之声 |
其他 |
20 |
人名、邮箱、人物关系、指代、账号等 |
我不是李四光,我是他的朋友 我的支付宝账号是 douni@163.com 高清 |
以上是系统的内置能力,并且正在持续挖掘。预计到930时,内置意图会进一步得到扩展,增加行业意图,内置意图数量增加到1,000个以上。
二、演示系统内置意图以及内置实体的使用方式
如图所示,是提前定义好的查天气的对话流:
对话流包括触发节点查天气,触发条件是查天气的意图,查天气的意图,编辑了许多话术 lgf,对应会进行城市参数的收集,最后会调用查询天气的 API 返回查询天气的结果,如果对话流当中想做其他功能,例如用户转人工,询问其他问题。此时如果查询天气是可以完成的:
但是无法转人工。如果要给机器人增加转人工的功能,正常的逻辑是对应定义一个转人工的意图。意图较为麻烦,需要添加许多话术,而且需要测试。但此时系统存在内置意图:
查天气意图是用户自定义的,其他的是系统内置的,共有19个,此时可以选择转人工,触发条件会自动选择:
进行保存即可。再加入对应的转人工的回复节点:
名称为转人工回复文本,回复内容为人工服务转接中。
上传完成之后进行测试:
此时能够正常识别转人工意图。也就是说通过引用系统的意图,节省成本。实体分两种类型,一种是用户自定义的,用户可以自行创建自己的实体。实体分为两种类型,一种是标准名词的实体,另一种是正则名词的实体。标准名词每个实体是由许多个词组成的,正则是由正则式表达式组成的。以下是用户自定义的:
除了自定义之外,系统还预置了一些实体:
常见意图有参数,就是需要收集城市。也就是需要查询哪个城市的天气:
选用完成之后就能进行识别对应的城市,演示如下:
将其替换为省份:
结果如下:
不需要用户自己做配置,以上是系统内置意图以及系统实体的大致使用流程。用户在进行对话流的机器人配置过程当中,可以首先使用统内置的意图和实体,首先内置的效果比较有保障,使用成本较低。后续会不断完善内置意图和实体,使其数量越来越丰富。