《R语言机器学习:实用案例分析》——2.1节理解机器学习

简介:

本节书摘来自华章社区《R语言机器学习:实用案例分析》一书中的第2章,第2.1节理解机器学习,作者[印度] 拉格哈夫·巴利(Raghav Bali)迪潘简·撒卡尔(Dipanjan Sarkar),更多章节内容可以访问云栖社区“华章社区”公众号查看

2.1 理解机器学习
我们是不是被教导说,计算机系统需要编程才能完成特定任务?只有对它们进行编程的情况下,它们在完成任务时才可能快百万倍。我们必须对每一个步骤进行编程,然后才能使这些系统工作并完成任务。那么机器学习是不是一个非常矛盾的概念?
简单地说,机器学习指的是一种教授系统学习执行特定任务的方法,例如学习一个功能。尽管听起来很简单,但它有点混乱而又难以理解。感觉混乱的原因是,我们观察系统(特别是计算机系统)工作的方式与我们学习的方式是两种几乎没有交集的概念。更难以理解的原因是,虽然学习是人类固有的能力,但是很难用文字表达,更不用说教授给系统。
那么机器学习是什么呢?在我们试着回答这个问题之前,需要在哲学层面理解,机器学习不仅仅是一种编程方式。机器学习意味着很多内容。
有许多种描述机器学习的方法。延用我们前一章中提出的高层次的定义,让我们看一看1997年Tom Mitchell给出的定义:
“如果在经验E的帮助下,依据性能指标P度量的任务T的性能有了提升,则称计算机程序就任务T和性能指标P从经验E中学习。”
Tom Mitchell教授简介
他生于1951年,是美国计算机科学家,卡耐基–梅隆大学(Carnegie Mellon University,CMU)教授。他也是CMU机器学习系主任。他以在机器学习、人工智能和认知神经科学领域的贡献而闻名。他是各种机构的成员,例如人工智能进展协会。
现在,让我们尝试通过一个例子来理解这个简单而又强大定义的含义。假如我们想要建立一个系统来预测天气。对于当前的例子,系统的任务T是预测某个地方的天气。为了完成这个任务,它需要依靠以往的天气信息。我们将这称为经验E。系统的性能指标P用来衡量对任意一天的天气预测的好坏程度。因此,我们可以归纳为,如果一个系统在历史信息(或者称为经验E)的帮助下,能够更好地预测天气(或者称为提升它的性能P),则认为系统成功地学习了如何预测天气(或任务T)。
正如我们在上述例子中所看到的,这个定义不仅能帮助我们从工程的角度理解机器学习,也给我们提供了工具来量化这些术语。这个定义帮助我们了解到,学习一个特定任务涉及理解和处理以经验形式呈现的数据。它还提到,如果一个计算机程序进行学习,它的性能将在经验的帮助下得到提升,这和我们的学习方式非常相近。

相关文章
|
16天前
|
机器学习/深度学习 传感器 运维
使用机器学习技术进行时间序列缺失数据填充:基础方法与入门案例
本文探讨了时间序列分析中数据缺失的问题,并通过实际案例展示了如何利用机器学习技术进行缺失值补充。文章构建了一个模拟的能源生产数据集,采用线性回归和决策树回归两种方法进行缺失值补充,并从统计特征、自相关性、趋势和季节性等多个维度进行了详细评估。结果显示,决策树方法在处理复杂非线性模式和保持数据局部特征方面表现更佳,而线性回归方法则适用于简单的线性趋势数据。文章最后总结了两种方法的优劣,并给出了实际应用建议。
52 7
使用机器学习技术进行时间序列缺失数据填充:基础方法与入门案例
|
3月前
|
机器学习/深度学习 数据采集 算法
R语言中的机器学习库:caret与mlr的深度解析
【9月更文挑战第2天】Caret和mlr是R语言中两个非常重要的机器学习库,它们在数据预处理、模型构建、调优和评估等方面提供了丰富的功能。Caret以其易用性和集成性著称,适合初学者和快速原型开发;而mlr则以其全面性和可扩展性见长,适合处理复杂的机器学习项目。在实际应用中,用户可以根据具体需求和项目特点选择合适的库进行开发。无论是学术研究、商业智能还是教育场景,这两个库都能为数据科学家和机器学习爱好者提供强大的支持。
|
5月前
|
机器学习/深度学习 人工智能 算法
没想到!AlphaZero式树搜索也能用来增强大语言模型推理与训练
【7月更文挑战第26天】Xidong Feng等研究人员提出了一项创新方法,通过采用AlphaZero式的树搜索算法来增强大语言模型(LLMs)的推理与训练能力。这项技术,称为TS-LLM(Tree-Search for LLMs),将LLMs的解码过程视为搜索问题,并运用AlphaZero的树搜索来指导这一过程。TS-LLM不仅提升了模型的通用性和适应性,还在多个任务中实现了显著的性能提升。此外,它能在训练阶段指导LLMs学习更优的解码策略。尽管如此,TS-LLM依赖于高质量的预训练LLM,并面临较高的计算成本挑战。[论文](https://arxiv.org/abs/2309.17179)
96 5
|
6月前
|
机器学习/深度学习 算法 数据挖掘
机器学习之sklearn基础——一个小案例,sklearn初体验
机器学习之sklearn基础——一个小案例,sklearn初体验
166 6
|
6月前
|
机器学习/深度学习 算法
【阿旭机器学习实战】【30】二手车价格预估--KNN回归案例
【阿旭机器学习实战】【30】二手车价格预估--KNN回归案例
|
2月前
|
机器学习/深度学习 数据采集 人工智能
R语言是一种强大的编程语言,广泛应用于统计分析、数据可视化、机器学习等领域
R语言是一种广泛应用于统计分析、数据可视化及机器学习的强大编程语言。本文为初学者提供了一份使用R语言进行机器学习的入门指南,涵盖R语言简介、安装配置、基本操作、常用机器学习库介绍及实例演示,帮助读者快速掌握R语言在机器学习领域的应用。
121 3
|
2月前
|
机器学习/深度学习 并行计算 数据挖掘
R语言是一种强大的统计分析工具,广泛应用于数据分析和机器学习领域
【10月更文挑战第21天】R语言是一种强大的统计分析工具,广泛应用于数据分析和机器学习领域。本文将介绍R语言中的一些高级编程技巧,包括函数式编程、向量化运算、字符串处理、循环和条件语句、异常处理和性能优化等方面,以帮助读者更好地掌握R语言的编程技巧,提高数据分析的效率。
62 2
|
4月前
|
机器学习/深度学习 人工智能 数据处理
【人工智能】项目实践与案例分析:利用机器学习探测外太空中的系外行星
探测外太空中的系外行星是天文学和天体物理学的重要研究领域。随着望远镜观测技术的进步和大数据的积累,科学家们已经能够观测到大量恒星的光度变化,并尝试从中识别出由行星凌日(行星经过恒星前方时遮挡部分光线)引起的微小亮度变化。然而,由于数据量巨大且信号微弱,传统方法难以高效准确地识别所有行星信号。因此,本项目旨在利用机器学习技术,特别是深度学习,从海量的天文观测数据中自动识别和分类系外行星的信号。这要求设计一套高效的数据处理流程、构建适合的机器学习模型,并实现自动化的预测和验证系统。
90 1
【人工智能】项目实践与案例分析:利用机器学习探测外太空中的系外行星
|
3月前
|
机器学习/深度学习 人工智能 算法
利用机器学习预测股市趋势:一个实战案例
【9月更文挑战第5天】在这篇文章中,我们将探索如何使用机器学习技术来预测股市趋势。我们将通过一个简单的Python代码示例来演示如何实现这一目标。请注意,这只是一个入门级的示例,实际应用中可能需要更复杂的模型和更多的数据。
|
3月前
|
机器学习/深度学习 算法 前端开发
R语言基础机器学习模型:深入探索决策树与随机森林
【9月更文挑战第2天】决策树和随机森林作为R语言中基础且强大的机器学习模型,各有其独特的优势和适用范围。了解并熟练掌握这两种模型,对于数据科学家和机器学习爱好者来说,无疑是一个重要的里程碑。希望本文能够帮助您更好地理解这两种模型,并在实际项目中灵活应用。