课时3 :高级能力和算法效果优化(一)|学习笔记

简介: 快速学习课时3 :高级能力和算法效果优化

开发者学堂课程【3节课走进云小蜜产品:课时3 :高级能力和算法效果优化】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/298/detail/3497


课时3 :高级能力和算法效果优化(一)


内容介绍:

一、简介

二、演示系统内置意图以及内置实体的使用方法

三、意图话术高级配置方式 LGF

四、机器人训练流程

五、总结

 

一、简介

本课程的主要内容是高级能力与算法效果优化,主要目标是给用户提供针对机器人效果优化的抓手。让用户了解并掌握机器人效果优化的常用的流程以及手段,帮助用户将机器人的自然语言理解水平包括实体识别,意图识别等做到90%以上,达到业务可交付的效果。

本次课程大纲如下:

1.系统内置意图、实体

2.意图话术高级配置方式 LGF

3.机器人训练

数据筛选标注

小样本意图识别

大样本意图识别

第一部分是系统内置意图和实体,为了最大程度的减少用户对话构建的成本,所以离线做了挖掘和沉淀,把通用的常用的意图和实体,进行了内置,并且保证内置的意图实体效果能够,达到好的水平,

第二部分是意图话术高级配置方式 lgf,该配置方式主要解决的问题是在对话启动以及干预时,如果仅仅只能一条一条话术配置,配置效率较低,所以采用 LGF 的方式,配置单条,效果能够达到上百条或是更多话术的效果,能够节省配置成本。

第三部分是机器人训练,为了更好地保障机器人的理解水平,引入了机器学习算法。机器学习算法需要大量标注数据让模型进行学习,模型如果没有数据就无法进行学习,所以第一部分介绍数据筛选和标注。针对数据标注量的数量,如果每条意图只标注十条,该情况下较为适合使用系统内置的意图识别模型,但如果意图标注量本量较多,达到了百级别或更多,就可以直接训练大样本的监督学习模型,意图识别会更加好。对于系统内置的意图和实体,目前系统内置了19种通用的意图:停止、取消、感谢、返回、重听、上一个、下一个、你是谁、转人工、信号不好、友好问候、寻求帮助、通用否定、通用肯定、客户不方便、客户说再见、骂人说脏话、质疑是机器人、客户反问什么事。内置通用意图有19个,模型F1=91.96%,内置实体方面沉淀了包括时间,地点,数字,医疗,生活,文娱及其他方面七大类。内部包括一百多个小类:

实体类别

数量

主要类别

示例

时间类

7

日期、时间、周期时间、持续时间等

2020年6月18号下午5点进行了三个小时的会议

地点类

28

国家、行政区划、POI系列等

我老家是山东省烟台市

我住在千鹤家园小区

数字类

22

各类数字、各类数量词、车牌、电话号等

工作完成了三分之一

车牌号是京 N98U6

医疗类

16

疾病、症状、检查、药品、诊断、用药频率等

老王患有糖尿病

我今天体温正常

这个药每天三次

生活类

8

快递相关、菜谱、食材等

帮我发顺丰快递

我要点一个西红柿炒鸡蛋

文娱类

3

人物名、电影和广播电台

是张艺谋拍的闪闪的红星吗

我要听央广之声

其他

20

人名、邮箱、人物关系、指代、账号等

我不是李四光,我是他的朋友

我的支付宝账号是 douni@163.com 高清

以上是系统的内置能力,并且正在持续挖掘。预计到930时,内置意图会进一步得到扩展,增加行业意图,内置意图数量增加到1,000个以上。


二、演示系统内置意图以及内置实体的使用方式

如图所示,是提前定义好的查天气的对话流:

image.png

对话流包括触发节点查天气,触发条件是查天气的意图,查天气的意图,编辑了许多话术 lgf,对应会进行城市参数的收集,最后会调用查询天气的 API 返回查询天气的结果,如果对话流当中想做其他功能,例如用户转人工,询问其他问题。此时如果查询天气是可以完成的:

image.png

但是无法转人工。如果要给机器人增加转人工的功能,正常的逻辑是对应定义一个转人工的意图。意图较为麻烦,需要添加许多话术,而且需要测试。但此时系统存在内置意图:

image.png

查天气意图是用户自定义的,其他的是系统内置的,共有19个,此时可以选择转人工,触发条件会自动选择:

image.png

进行保存即可。再加入对应的转人工的回复节点:

名称为转人工回复文本,回复内容为人工服务转接中。

上传完成之后进行测试:

image.png

此时能够正常识别转人工意图。也就是说通过引用系统的意图,节省成本。实体分两种类型,一种是用户自定义的,用户可以自行创建自己的实体。实体分为两种类型,一种是标准名词的实体,另一种是正则名词的实体。标准名词每个实体是由许多个词组成的,正则是由正则式表达式组成的。以下是用户自定义的:

image.png

除了自定义之外,系统还预置了一些实体:

常见意图有参数,就是需要收集城市。也就是需要查询哪个城市的天气:

选用完成之后就能进行识别对应的城市,演示如下:

将其替换为省份:

image.png

结果如下:

image.png

不需要用户自己做配置,以上是系统内置意图以及系统实体的大致使用流程。用户在进行对话流的机器人配置过程当中,可以首先使用统内置的意图和实体,首先内置的效果比较有保障,使用成本较低。后续会不断完善内置意图和实体,使其数量越来越丰富。

相关文章
|
2月前
|
缓存 监控 Java
大厂性能优化的10大顶级方案 (万字图文史上最全)
本文详细介绍了大厂性能优化的10大顶奢方案,涵盖代码优化、缓存优化、异步优化、多线程优化、前端优化、微服务架构优化、硬件升级、数据库优化、过载保护优化以及度量与监控系统等方面。每部分不仅提供了理论知识,还结合实际案例和代码示例,帮助读者全面理解和应用这些优化策略。文章还特别强调了架构设计的重要性,指出架构师需要具备多方面的知识和技能,包括硬件、软件、网络协议、分布式知识等,以应对复杂的技术挑战。最后,作者尼恩分享了自己多年的经验,提供了丰富的技术资源和实战指导,助力读者在面试和工作中取得成功。
大厂性能优化的10大顶级方案 (万字图文史上最全)
|
2月前
|
机器学习/深度学习 自然语言处理 并行计算
深度学习笔记(十四):Transormer知识总结
关于深度学习中Transformer模型的知识总结,涵盖了Self-attention机制、QKV、Multi-head attention、位置编码和并行运算等关键概念,以及如何在PyTorch中实现Self-attention。
68 1
|
4月前
|
自然语言处理 前端开发 JavaScript
前端进阶必读:JS闭包深度解析,掌握这一特性,你的代码将焕然一新!
【8月更文挑战第23天】闭包是JavaScript的一项高级功能,让函数能够访问和操作外部函数作用域中的变量。本文深入解析闭包概念、组成及应用场景。闭包由函数及其词法环境构成,通过在一个函数内定义另一个函数来创建。它有助于封装私有变量、维持状态和动态生成函数。然而,不当使用闭包可能导致内存泄漏或性能问题。掌握闭包对于实现模块化代码和成为优秀前端开发者至关重要。
44 0
|
存储 Linux 测试技术
2023年C/C++高性能技术知识大整理(进阶到大神级别)
2023年C/C++高性能技术知识大整理(进阶到大神级别)
|
机器学习/深度学习 自然语言处理 算法
课时3 :高级能力和算法效果优化(三)|学习笔记
快速学习课时3 :高级能力和算法效果优化
159 0
课时3 :高级能力和算法效果优化(三)|学习笔记
|
自然语言处理 算法 机器人
课时3 :高级能力和算法效果优化(二)|学习笔记
快速学习课时3 :高级能力和算法效果优化
123 0
课时3 :高级能力和算法效果优化(二)|学习笔记
|
机器学习/深度学习 数据采集 自然语言处理
高级能力和算法效果优化(二)| 学习笔记
快速学习高级能力和算法效果优化。
高级能力和算法效果优化(二)| 学习笔记
|
自然语言处理 算法 机器人
高级能力和算法效果优化(一)| 学习笔记
快速学习高级能力和算法效果优化。
高级能力和算法效果优化(一)| 学习笔记
|
运维 Kubernetes Cloud Native
研发模式的3个实践案例(一)|学习笔记
快速学习研发模式的3个实践案例(一)
178 0
研发模式的3个实践案例(一)|学习笔记
|
机器学习/深度学习 数据采集 自然语言处理
高级能力和算法效果优化 | 学习笔记
简介:快速学习高级能力和算法效果优化
199 0
高级能力和算法效果优化 | 学习笔记