【学习记录】《DeepLearning.ai》第八课:机器学习策略(1)(ML strategy(1))

简介: 2021/9/9

第八课:机器学习策略(1)(ML strategy(1))

1.1 什么是ML策略

image

ML策略总结就是让人少走弯路,能够选择合适的方法来优化系统。


1.2 正交化(Orthogonalization)

image

针对不同的环节出现的问题进行不同方式的解决。判断出系统的性能瓶颈出现在那里,然后找到一组特定的旋钮来调整系统,来改善它特定的性能。


1.3 单一数字评估指标(Single number evaluation metric)

image

对于上面两个分类器,分别给出了它们的查准率和召回率,通常这两个特征必须折中,因此无法判断哪个分类器的效果更好,我们引入一个参数:

$$ F_1Score:2\frac{PR}{P+R} $$

如上图所示,很显然分类器A的参数值FScore最大,因此选择A分类器。

选择$F_1Score$较大的那个值

通常将算法的预测结果分为四种情况:

1.正确肯定(True Positive,TP):预测为真,实际为真;

2.正确否定(True Negative,TN):预测为假,实际为真;

3.错误肯定(False Positive,FP):预测为真,实际为假;

4.错误否定(False Negative,FN):预测为假,实际为真。

$$ 查准率(Precision)=\frac{TP}{TP+FP}\\ 查全率/召回率(Recall)=\frac{TP}{TP+FN} $$

image

查准率通常用P表示,查全率或召回率通常用R表示,则可以得到上面F_1Score的公式。

image

对于如上图可以选择每个算法在各地的误差平均值,计算之后发现平均值误差最小的是算法C,因此我们选择算法C.

这就是单一数字评估指标的基本概念,选择一个数字来评估。


1.4 满足和优化指标(Satisficing and opeimizing metrics)

当需要顾及多个指标,比如有一个优化指标以及一个或多个满足指标,对于需要满足的指标,需要达到一定门槛即可。这些评价指标必须是在训练集、开发集、测试集上求出来的,因此必须设立训练集、开发集、测试集。下节课见。


1.5 训练/开发/测试集划分(Train/dev/test distributions)

选择开发集以及评估指标,就定义了所要瞄准的目标。同时让开发集和测试集在同一分布之中。


1.6 开发集和测试集的大小(Size of dev and test sets)

image

划分训练集、开发集、测试集划分方法如上,如果数据量较少可以划分为7:3和6:2:2.但如果数据量比较大,可以划分为98:1:1。

在实际工作中,可能有时候不需要测试集,只有开发集和训练集两部分。测试集的目的是评估最终的成本偏差。


1.7 何时改变开发/测试集/指标

实操经验:首先构建分类器和指标,将设立目标作为第一步,而瞄准和射击目标作为第二步,也就是在设立目标之后,应该想着如何优化系统提高指标评分,比如改变神经网络的优化成本函数J。

在解决问题时候,应该首先设立评估指标和开发集。


1.8 为何比较机器学习和人类的表现

贝叶斯最优错误率:指理论上可能达到的最优错误率,无论如何设置,都无法让其超过一定的准确度。

如上图蓝线为人类的精确度,绿线为贝叶斯最优错误率,紫色线表示机器学习的学习表现。

对于人类擅长的任务:比如可以让人标记数据,人工错误率分析,同时更好的分析偏差和方差。


1.9 可避免偏差(Avoidable bias)

image

选择避免方差策略还是避免偏差策略:

如上图,当贝叶斯误差与训练集误差之差比开发集误差与训练集误差之差比较相对较大时候,选择避免偏差策略,

相反,当贝叶斯误差与训练集误差之差比开发集误差与训练集误差之差比较相对较小时候,选择避免方差策略。


1.10 理解人的表现

image

image

人类水平错误率可以用贝叶斯错误率来近似代替,在人类水平误差与训练集误差之间用来调试偏差,在训练集误差与开发集误差之间人们用来调试方差。


1.11 超过人的表现

image

机器学习超过人的水平???


1.12 改善你的模型表现

image

解决高方差(过拟合)问题:

1.获得更多的训练样本

2.减少特征的数量

3.尝试增加正则化程度$\lambda$

解决高偏差(欠拟合)问题:

1.增加特征的数量

2.增加多项式特征

3.减少正则化程度$\lambda$

4.训练更好的优化算法,如Rmsprop,adam,momunte等等

如上图所示


2021/9/9结束,冲冲冲

相关文章
|
1月前
|
存储 人工智能 大数据
AI开发新范式,PAI模型构建平台升级发布
本次分享由阿里云智能集团产品专家高慧玲主讲,聚焦AI开发新范式及PAI模型构建平台的升级。分享分为四个部分,围绕“人人可用”和“面向生产”两大核心理念展开。通过降低AI工程化门槛、提供一站式全链路服务,PAI平台致力于帮助企业和开发者更高效地实现AI应用。案例展示中,介绍了多模态模型微调在文旅场景的应用,展示了如何快速复现并利用AI解决实际问题。最终目标是让AI技术更普及,赋能各行业,推动社会进步。
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
Java+机器学习基础:打造AI学习基础
随着人工智能(AI)技术的飞速发展,越来越多的开发者开始探索如何将AI技术应用到实际业务场景中。Java作为一种强大的编程语言,不仅在企业级应用开发中占据重要地位,在AI领域也展现出了巨大的潜力。本文将通过模拟一个AI应用,从背景历史、业务场景、优缺点、底层原理等方面,介绍如何使用Java结合机器学习技术来打造一个AI学习的基础Demo。
41 18
|
1月前
|
机器学习/深度学习 人工智能 算法
机器学习算法的优化与改进:提升模型性能的策略与方法
机器学习算法的优化与改进:提升模型性能的策略与方法
268 13
机器学习算法的优化与改进:提升模型性能的策略与方法
|
1月前
|
机器学习/深度学习 人工智能 算法
FinRobot:开源的金融专业 AI Agent,提供市场预测、报告分析和交易策略等金融解决方案
FinRobot 是一个开源的 AI Agent 平台,专注于金融领域的应用,通过大型语言模型(LLMs)构建复杂的金融分析和决策工具,提供市场预测、文档分析和交易策略等多种功能。
240 13
FinRobot:开源的金融专业 AI Agent,提供市场预测、报告分析和交易策略等金融解决方案
|
2月前
|
存储 人工智能 算法
【AI系统】计算图的优化策略
本文深入探讨了计算图的优化策略,包括算子替换、数据类型转换、存储优化等,旨在提升模型性能和资源利用效率。特别介绍了Flash Attention算法,通过分块计算和重算策略优化Transformer模型的注意力机制,显著减少了内存访问次数,提升了计算效率。此外,文章还讨论了内存优化技术,如Inplace operation和Memory sharing,进一步减少内存消耗,提高计算性能。
151 34
【AI系统】计算图的优化策略
|
1月前
|
SQL 人工智能 关系型数据库
PolarDB-PG AI最佳实践 2 :PolarDB AI X EAS实现自定义库内模型推理最佳实践
PolarDB通过POLAR_AI插件支持使用SQL调用AI/ML模型,无需专业AI知识或额外部署环境。结合阿里云EAS在线模型服务,可轻松部署自定义模型,在SQL中实现如文本翻译等功能。
|
2月前
|
机器学习/深度学习 人工智能 并行计算
转载:【AI系统】AI轻量化与并行策略
本文探讨了AI计算模式对AI芯片设计的重要性,重点分析了轻量化网络模型和大模型分布式并行两大主题。轻量化网络模型通过减少模型参数量和计算量,实现在资源受限设备上的高效部署;大模型分布式并行则通过数据并行和模型并行技术,解决大模型训练中的算力和内存瓶颈,推动AI技术的进一步发展。
转载:【AI系统】AI轻量化与并行策略
|
1月前
|
人工智能 安全 大数据
PAI年度发布:GenAI时代AI基础设施的演进
本文介绍了AI平台在大语言模型时代的新能力和发展趋势。面对推理请求异构化、持续训练需求及安全可信挑战,平台推出了一系列优化措施,包括LLM智能路由、多模态内容生成服务、serverless部署模式等,以提高资源利用效率和降低使用门槛。同时,发布了训推一体调度引擎、竞价任务等功能,助力企业更灵活地进行训练与推理任务管理。此外,PAI开发平台提供了丰富的工具链和最佳实践,支持从数据处理到模型部署的全流程开发,确保企业和开发者能高效、安全地构建AI应用,享受AI带来的红利。
|
2月前
|
人工智能 搜索推荐 决策智能
不靠更复杂的策略,仅凭和大模型训练对齐,零样本零经验单LLM调用,成为网络任务智能体新SOTA
近期研究通过调整网络智能体的观察和动作空间,使其与大型语言模型(LLM)的能力对齐,显著提升了基于LLM的网络智能体性能。AgentOccam智能体在WebArena基准上超越了先前方法,成功率提升26.6个点(+161%)。该研究强调了与LLM训练目标一致的重要性,为网络任务自动化提供了新思路,但也指出其性能受限于LLM能力及任务复杂度。论文链接:https://arxiv.org/abs/2410.13825。
69 12
|
2月前
|
人工智能 安全 算法
PAI负责任的AI解决方案: 安全、可信、隐私增强的企业级AI
在《PAI可信AI解决方案》会议中,分享了安全、可信、隐私增强的企业级AI。会议围绕三方面展开:首先通过三个案例介绍生活和技术层面的挑战;其次阐述构建AI的关键要素;最后介绍阿里云PAI的安全功能及未来展望,确保数据、算法和模型的安全与合规,提供全方位的可信AI解决方案。

热门文章

最新文章