重磅 | 19 页花书精髓笔记!你可能正需要这份知识清单

简介: 重磅 | 19 页花书精髓笔记!你可能正需要这份知识清单

image.png

《深度学习》,又名“花书”。该书由三位大佬 Ian Goodfellow、Yoshua Bengio 和 Aaron Courville 撰写,是深度学习领域奠基性的经典教材,被誉为深度学习“圣经”。


原书内容非常充实,接近 800 页。读完之后,及时进行高度概括和经验总结是十分有帮助的。本文给大家介绍一份来自 Microsoft 计算机软件工程师 Jeff Macaluso 总结的关于花书的精髓笔记,我们一起来看一下吧!


image.png


笔记地址:


https://jeffmacaluso.github.io/post/DeepLearningRulesOfThumb/


为什么写这份笔记?


关于为什么写这份笔记,作者是这么说的:


当我在研究生院第一次学习神经网络时,我问我的教授在选择架构和超参数时是否有经验法则。我半以为他会回答:好吧,有点,但不是真的。毕竟对于神经网络来说,有比其他机器学习算法更多的选择!当我读到 Ian Goodfellow, Yoshua Bengio 和 Aaaron Courville 的《深度学习》一书时,我一直在思考这个问题,并决定编制一份贯穿这本书的知识清单。事实证明,它们还有很多,特别是它们可以完成很多类型的神经网络和任务。


如何评价这份笔记?


作者这样评价自己的这份笔记:


有趣的是,这些经验法则中有很多并没有很好地建立起来——深度学习仍然是一个相对较新的研究领域,因此下面列出的许多规则只是研究人员最近发现的一些东西。除此之外,在这本书中还有很多领域,作者会陈述(更多学术术语)“我们不知道为什么这是有效的,但我们可以看到它是有效的”或者“我们知道这不是最好的方法,但它是一个活跃的研究领域,我们目前不知道任何更好的方法”。


同时也对花书作了中肯的评价:


这不是一个深入学习的书评,但如果你想更深入地了解更成熟的方法以及研究的活跃领域(在出版时),我个人会推荐它。Fast.ai 的 Jeremy Howard(一个学习深入学习实践方面的优秀来源)批评了这本书,因为它过于关注数学和理论,但我发现除了我跳过的所有数学公式外,它还很好地解释了概念和实践方法背后的直觉。


笔记目录:


这份完整的精髓笔记目录包括:


1. 应用数学与机器学习基础

  • 介绍
  • 数值计算
  • 机器学习基础

2. 深度网络:现代实践

  • 深度前馈网络
  • 深度学习中的正则化
  • 深度模型中的优化
  • 卷积网络
  • 序列建模:循环和递归网络
  • 实践和方法论
  • 应用

3. 深度学习研究

  • 线性因子模型
  • 自编码器
  • 表示学习
  • 深度学习中的结构化概率模型
  • 蒙特卡罗方法
  • 近似推断
  • 深度生成模型


同时,作者整理了笔记的精简版关键知识点 TR:DR,便于快速浏览。


image.png

image.png

image.png


相关文章
|
3月前
|
存储 人工智能 监控
大模型显存优化实战手册:如何用有限显卡训练百亿参数模型?
AI博主maoku详解大模型显存优化:直击OOM痛点,拆解参数/梯度/优化器/激活值四大显存“大户”,揭秘1:1:6内存占比规律;实操九大技巧——梯度检查点、BF16混合精度、CPU卸载、算子融合等,并验证8卡80G全量微调72B模型的落地效果。省钱、提效、普惠,一文掌握显存优化核心方法论。(239字)
|
新零售 存储 人工智能
申报开启|2025年4月批次阿里云协同育人项目申报指南|云工开物
为推动《“十四五”教育发展规划》,阿里云支持教育部产学合作协同育人项目,邀请高校参与2025年4月批次申报。项目聚焦教学内容改革与实践基地建设,如AI+X专业课程和人工智能通识教育。提供资金、云计算资源和技术培训支持,旨在深化产教融合,培养创新人才。申报截止时间为2025年5月31日,详情见官网通知。
|
9月前
|
传感器 数据采集 物联网
基于STM32和FreeRTOS的智能手环项目设计与实现【免费开源】
随着可穿戴设备的普及,智能手环逐渐成为健康管理、运动监测和生活便捷的重要工具。本项目旨在设计一款基于STM32微控制器和FreeRTOS实时操作系统的智能手环,具备心率监测、运动计步、睡眠分析以及蓝牙通信功能。通过FreeRTOS实现多任务调度,提高系统响应效率和资源利用率,同时保证低功耗设计,延长手环续航。
基于STM32和FreeRTOS的智能手环项目设计与实现【免费开源】
|
供应链 定位技术 数据库
仓库选址问题【数学规划的应用(含代码)】阿里达院MindOpt
使用阿里云MindOpt工具,文章展示了如何解决仓库选址的数学规划问题。该问题涉及构建工厂以供应多个商店,考虑因素包括建设成本、库存成本、运输成本和需求量。MindOpt是一个优化求解器,能处理大规模数据的数学规划问题。通过声明集合、参数、变量、目标函数和约束条件,构建模型并求解,以最小化总成本。文中还提到了不同行业的应用场景,如农业、制造业、零售业和电商,并提供了视频讲解和代码示例。
ElementUI表单校验trigger设为change无效问题
ElementUI表单校验trigger设为change无效问题
901 1
|
Windows Python
python获取windows机子上运行的程序名称
python获取windows机子上运行的程序名称
|
网络安全 数据安全/隐私保护
华为USG6000V防火墙的初始密码及修改密码的操作
华为USG6000V防火墙的初始密码及修改密码的操作
911 0
|
安全 网络安全 数据安全/隐私保护
什么是双因素身份验证 (2FA)?
【4月更文挑战第14天】
3032 2
|
存储 人工智能 安全
Gartner预测2025年IT支出将大幅增加
Gartner预测2025年IT支出将大幅增加
|
算法 数据可视化 网络安全
清华等高校推出首个开源大模型水印工具包MarkLLM,支持近10种最新水印算法
【6月更文挑战第27天】清华大学等高校发布了开源工具MarkLLM,这是首个专注于大语言模型水印的工具包,支持近10种先进算法。该工具统一了水印实现,便于比较和使用,旨在促进水印技术在保障信息真实性和网络安全上的应用。MarkLLM提供直观界面、可视化及自动化评估,推动了大模型水印研究的进步。[论文链接:](https://arxiv.org/abs/2405.10051)**
705 5