课时3 :高级能力和算法效果优化(一)|学习笔记

简介: 快速学习课时3 :高级能力和算法效果优化

开发者学堂课程【3节课走进云小蜜产品:课时3 :高级能力和算法效果优化】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/298/detail/3497


课时3 :高级能力和算法效果优化(一)


内容介绍:

一、简介

二、演示系统内置意图以及内置实体的使用方法

三、意图话术高级配置方式 LGF

四、机器人训练流程

五、总结

 

一、简介

本课程的主要内容是高级能力与算法效果优化,主要目标是给用户提供针对机器人效果优化的抓手。让用户了解并掌握机器人效果优化的常用的流程以及手段,帮助用户将机器人的自然语言理解水平包括实体识别,意图识别等做到90%以上,达到业务可交付的效果。

本次课程大纲如下:

1.系统内置意图、实体

2.意图话术高级配置方式 LGF

3.机器人训练

数据筛选标注

小样本意图识别

大样本意图识别

第一部分是系统内置意图和实体,为了最大程度的减少用户对话构建的成本,所以离线做了挖掘和沉淀,把通用的常用的意图和实体,进行了内置,并且保证内置的意图实体效果能够,达到好的水平,

第二部分是意图话术高级配置方式 lgf,该配置方式主要解决的问题是在对话启动以及干预时,如果仅仅只能一条一条话术配置,配置效率较低,所以采用 LGF 的方式,配置单条,效果能够达到上百条或是更多话术的效果,能够节省配置成本。

第三部分是机器人训练,为了更好地保障机器人的理解水平,引入了机器学习算法。机器学习算法需要大量标注数据让模型进行学习,模型如果没有数据就无法进行学习,所以第一部分介绍数据筛选和标注。针对数据标注量的数量,如果每条意图只标注十条,该情况下较为适合使用系统内置的意图识别模型,但如果意图标注量本量较多,达到了百级别或更多,就可以直接训练大样本的监督学习模型,意图识别会更加好。对于系统内置的意图和实体,目前系统内置了19种通用的意图:停止、取消、感谢、返回、重听、上一个、下一个、你是谁、转人工、信号不好、友好问候、寻求帮助、通用否定、通用肯定、客户不方便、客户说再见、骂人说脏话、质疑是机器人、客户反问什么事。内置通用意图有19个,模型F1=91.96%,内置实体方面沉淀了包括时间,地点,数字,医疗,生活,文娱及其他方面七大类。内部包括一百多个小类:

实体类别

数量

主要类别

示例

时间类

7

日期、时间、周期时间、持续时间等

2020年6月18号下午5点进行了三个小时的会议

地点类

28

国家、行政区划、POI系列等

我老家是山东省烟台市

我住在千鹤家园小区

数字类

22

各类数字、各类数量词、车牌、电话号等

工作完成了三分之一

车牌号是京 N98U6

医疗类

16

疾病、症状、检查、药品、诊断、用药频率等

老王患有糖尿病

我今天体温正常

这个药每天三次

生活类

8

快递相关、菜谱、食材等

帮我发顺丰快递

我要点一个西红柿炒鸡蛋

文娱类

3

人物名、电影和广播电台

是张艺谋拍的闪闪的红星吗

我要听央广之声

其他

20

人名、邮箱、人物关系、指代、账号等

我不是李四光,我是他的朋友

我的支付宝账号是 douni@163.com 高清

以上是系统的内置能力,并且正在持续挖掘。预计到930时,内置意图会进一步得到扩展,增加行业意图,内置意图数量增加到1,000个以上。


二、演示系统内置意图以及内置实体的使用方式

如图所示,是提前定义好的查天气的对话流:

image.png

对话流包括触发节点查天气,触发条件是查天气的意图,查天气的意图,编辑了许多话术 lgf,对应会进行城市参数的收集,最后会调用查询天气的 API 返回查询天气的结果,如果对话流当中想做其他功能,例如用户转人工,询问其他问题。此时如果查询天气是可以完成的:

image.png

但是无法转人工。如果要给机器人增加转人工的功能,正常的逻辑是对应定义一个转人工的意图。意图较为麻烦,需要添加许多话术,而且需要测试。但此时系统存在内置意图:

image.png

查天气意图是用户自定义的,其他的是系统内置的,共有19个,此时可以选择转人工,触发条件会自动选择:

image.png

进行保存即可。再加入对应的转人工的回复节点:

名称为转人工回复文本,回复内容为人工服务转接中。

上传完成之后进行测试:

image.png

此时能够正常识别转人工意图。也就是说通过引用系统的意图,节省成本。实体分两种类型,一种是用户自定义的,用户可以自行创建自己的实体。实体分为两种类型,一种是标准名词的实体,另一种是正则名词的实体。标准名词每个实体是由许多个词组成的,正则是由正则式表达式组成的。以下是用户自定义的:

image.png

除了自定义之外,系统还预置了一些实体:

常见意图有参数,就是需要收集城市。也就是需要查询哪个城市的天气:

选用完成之后就能进行识别对应的城市,演示如下:

将其替换为省份:

image.png

结果如下:

image.png

不需要用户自己做配置,以上是系统内置意图以及系统实体的大致使用流程。用户在进行对话流的机器人配置过程当中,可以首先使用统内置的意图和实体,首先内置的效果比较有保障,使用成本较低。后续会不断完善内置意图和实体,使其数量越来越丰富。

相关文章
|
10月前
|
新能源
会后分享 | 精选十二:整车性能开发解决方案
本文由上海安世亚太公司汽车行业技术经理章敏先生在新能源汽车研讨会上所发表的演讲,此内容详细地讲解了整车性能开发解决方案。
会后分享 | 精选十二:整车性能开发解决方案
|
7月前
|
存储 Linux 测试技术
2023年C/C++高性能技术知识大整理(进阶到大神级别)
2023年C/C++高性能技术知识大整理(进阶到大神级别)
|
机器学习/深度学习 自然语言处理 算法
课时3 :高级能力和算法效果优化(三)|学习笔记
快速学习课时3 :高级能力和算法效果优化
134 0
课时3 :高级能力和算法效果优化(三)|学习笔记
|
自然语言处理 算法 机器人
课时3 :高级能力和算法效果优化(二)|学习笔记
快速学习课时3 :高级能力和算法效果优化
95 0
课时3 :高级能力和算法效果优化(二)|学习笔记
|
自然语言处理 算法 机器人
高级能力和算法效果优化(一)| 学习笔记
快速学习高级能力和算法效果优化。
152 0
高级能力和算法效果优化(一)| 学习笔记
|
机器学习/深度学习 数据采集 自然语言处理
高级能力和算法效果优化(二)| 学习笔记
快速学习高级能力和算法效果优化。
163 0
高级能力和算法效果优化(二)| 学习笔记
|
运维 Kubernetes Cloud Native
研发模式的3个实践案例(一)|学习笔记
快速学习研发模式的3个实践案例(一)
154 0
研发模式的3个实践案例(一)|学习笔记
|
SQL 消息中间件 运维
环境管理的应用场景(一)|学习笔记
快速学习环境管理的应用场景(一)
227 0
环境管理的应用场景(一)|学习笔记
|
SQL 安全 关系型数据库
时空场景开发实践(二)|学习笔记
快速学习时空场景开发实践(二)
153 0
时空场景开发实践(二)|学习笔记
|
Java 关系型数据库 MySQL
入门案例(使用的资源介绍)|学习笔记
快速学习入门案例(使用的资源介绍)
76 0
入门案例(使用的资源介绍)|学习笔记