机器学习界的「五三」:这位学者整理了一份200页的练习册,关于无监督方法、推理和学习

简介: 机器学习界的「五三」:这位学者整理了一份200页的练习册,关于无监督方法、推理和学习

我们可能都听说过一句话:「Use it or lose it」。

当我们有段时间没练习一门外语或一项运动时,就会感到生疏,从而深刻地体验到这句话的含义。练习对于保持技能很重要,对于学习新技能也是关键的因素。这就是为什么许多教科书和课程都以「练习」为特色的原因。然而,一般的练习方案往往过于简短,或者有时根本不可用。这些练习不是掌握新技能的机会,反而成为挫败感的来源。

最近,爱丁堡大学信息学院的机器学习高级讲师 Michael U. Gutmann 领衔撰写了一本 211 页的「练习册」,其中包含一系列带有详细解决方案的练习。


下载地址:https://arxiv.org/pdf/2206.13446.pdf

Michael U. Gutmann 是爱丁堡大学信息学院机器学习高级讲师,隶属于自适应与神经计算研究所。他的研究兴趣主要在于开发推理和实验设计方法,并将它们应用于自然科学中的重大问题。


作者表示:「希望详细程度足以让读者遵循解决方案并理解所使用的技术。然而,这些练习不能替代机器学习的教科书或课程。我假设读者已经看过相关的理论和概念,现在只是想通过练习加深他们的理解。」

不出所料,随便打开一页,就是满满的公式……


虽然编程和计算机模拟在机器学习中极为重要,但本书中的练习大部分可以用笔和纸来解决。此外,这本练习册可以让读者加强数学技能,但这些练习最好与计算机练习搭配来用,以进一步加深理解。

这里收集的练习主要是 Michael U. Gutmann 为赫尔辛基大学「无监督机器学习」和爱丁堡大学「概率建模与推理」课程编撰的练习的组合。这些练习并未全面涵盖所有机器学习的分支,但重点关注了无监督方法、推理和学习。Latex 源代码可在 https://github.com/michaelgutmann/ml-pen-and-paper-exercises 获得。

这确实是一本值得收藏的练习册,有人认为,这本册子和德国一些大学的研究生数学课本很接近。


有人评价其为「近期看到的最有趣的 arXiv 文章」:


整本练习册分为 10 章,分别涉及:

  • 线性代数
  • 优化
  • 定向图模型
  • 非定向图模型
  • 图模型的表现力
  • 因子图和信息传递
  • 隐马尔可夫模型的推理
  • 基于模型的学习(包括 ICA 和非标准化模型)
  • 采样和蒙特卡洛积分
  • 变分推理


完整目录如下:

相关文章
|
8天前
|
机器学习/深度学习 数据采集 数据处理
谷歌提出视觉记忆方法,让大模型训练数据更灵活
谷歌研究人员提出了一种名为“视觉记忆”的方法,结合了深度神经网络的表示能力和数据库的灵活性。该方法将图像分类任务分为图像相似性和搜索两部分,支持灵活添加和删除数据、可解释的决策机制以及大规模数据处理能力。实验结果显示,该方法在多个数据集上取得了优异的性能,如在ImageNet上实现88.5%的top-1准确率。尽管有依赖预训练模型等限制,但视觉记忆为深度学习提供了新的思路。
16 2
|
1月前
|
机器学习/深度学习 数据采集 数据挖掘
特征工程在营销组合建模中的应用:基于因果推断的机器学习方法优化渠道效应估计
因果推断方法为特征工程提供了一个更深层次的框架,使我们能够区分真正的因果关系和简单的统计相关性。这种方法在需要理解干预效果的领域尤为重要,如经济学、医学和市场营销。
57 1
特征工程在营销组合建模中的应用:基于因果推断的机器学习方法优化渠道效应估计
|
1月前
|
机器学习/深度学习
如何用贝叶斯方法来解决机器学习中的分类问题?
【10月更文挑战第5天】如何用贝叶斯方法来解决机器学习中的分类问题?
|
1月前
|
机器学习/深度学习 算法 API
机器学习入门(六):分类模型评估方法
机器学习入门(六):分类模型评估方法
|
1月前
|
机器学习/深度学习 算法 搜索推荐
机器学习入门(四):距离度量方法 归一化和标准化
机器学习入门(四):距离度量方法 归一化和标准化
|
1月前
|
机器学习/深度学习 算法
【机器学习】迅速了解什么是集成学习
【机器学习】迅速了解什么是集成学习
|
2月前
|
机器学习/深度学习 Python
验证集的划分方法:确保机器学习模型泛化能力的关键
本文详细介绍了机器学习中验证集的作用及其划分方法。验证集主要用于评估模型性能和调整超参数,不同于仅用于最终评估的测试集。文中描述了几种常见的划分方法,包括简单划分、交叉验证、时间序列数据划分及分层抽样划分,并提供了Python示例代码。此外,还强调了在划分数据集时应注意随机性、数据分布和多次实验的重要性。合理划分验证集有助于更准确地评估模型性能并进行有效调优。
|
2月前
|
机器学习/深度学习 算法 搜索推荐
机器学习方法之强化学习
强化学习是一种机器学习方法,旨在通过与环境的交互来学习如何做出决策,以最大化累积的奖励。
57 4
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
【机器学习】机器学习、深度学习、强化学习和迁移学习简介、相互对比、区别与联系。
机器学习、深度学习、强化学习和迁移学习都是人工智能领域的子领域,它们之间有一定的联系和区别。下面分别对这四个概念进行解析,并给出相互对比、区别与联系以及应用场景案例分析。
87 1
|
3月前
|
机器学习/深度学习 人工智能 关系型数据库
【机器学习】Qwen2大模型原理、训练及推理部署实战
【机器学习】Qwen2大模型原理、训练及推理部署实战
645 0
【机器学习】Qwen2大模型原理、训练及推理部署实战