七本书籍带你打下机器学习和数据科学的数学基础

简介: 本文主要介绍七本关于机器学习和数据科学数学基础的经典教材,是一份不可多得的书单整理。

大多数人学习数据科学的重心放在编程上面,然而,要真正精通数据科学的话是不能够忽视数据科学背后的数据基础。本篇文章,将分享给读者我喜欢的七本有关于数据科学基础的书,下面将逐一为大家介绍这七本数学基础书,请大家开始“享受”吧!
首先要明确一点,我们为什么要为学习数据科学的数学基础而努力呢?以下是激励我的原因:

  • 人工智能正在快速的改变着世界。Geoffrey Hinton大牛使得我们重新对BP算法有了新的思考
  • 理解背后的数学原理会帮助你更好地理解人工智能的变革。它将帮助你从深度上理解人工智能,与那些浅尝辄止的研究者区分开来。
  • 它还将帮助你更好地了解人工智能知识产权(IP)的潜力。
  • 最后,理解数据科学背后的数学知识也能引导你进入人工智能和数据科学更高端的工作。

    1

1.统计学习理论的本质(The Nature Of Statistical Learning Theory)——Vladimir Vapnik

在数学界中,如果你想创建一个关于数学书的列表并不包括伟大的俄国数学家,那是不可能的。所以,在本文列表中的第一本书籍自然而然就是由Vladimir Vapnik编写的统计学习理论。该书是七本书中最难找到的一本,当然,在中国这都不是事儿。Vladimir Vapnik也是支持向量机(SVM)算法的创造者,其维基百科页面上介绍了很多关于他的工作。

2.模式分类(Pattern Classification)——Richard O Duda

类似于Vladimir Vapnik的书,Duda是另一个时代的经典书籍。首次发表于1973年,在25年后(2000年)得到更新,之后再也没有进行更新,但这并不妨碍本书成为一本重要的书籍。该书采用模式识别的方法,并涵盖了大量的算法。

3.机器学习:算法透视(Machine Learning: An Algorithmic Perspective, Second Edition (Chapman & Hall/Crc Machine Learning & Pattern Recognition))——Stephen Marsland

此书现在有第二版,这本书也是我读过最早的书籍之一。第一版和第二版都很好,其中第二版有更多的Python代码。与前两本书类似,该书也非常强调算法。

4.统计学习要素:数据挖掘、推理和预测(The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition)——Trevor Hastie, Robert Tibshirani, Jerome Friedman

又一本经典教材,我使用的版本印刷得非常好,具有很高的参考价值。

5.模式识别与机器学习(Pattern Recognition and Machine Learning (Information Science and Statistics))——Christopher M. Bishop

Christopher M. Bishop编写的模式识别和机器学习(信息科学和统计学)也是一本深入浅出且非常完善的书籍,参考价值高。

6.机器学习:理解数据的算法中的艺术和科学(Machine Learning: The Art and Science of Algorithms that Make Sense of Data)——Peter Flach

我喜欢Peter Flach的书籍,尽管购物网站上的一些评论说其有些冗长并缺少代码,但我喜欢其整本书的布局(算法的分组:逻辑模型、线性模型以及概率模型)和主题的整体处理。

7.深度学习(Deep Learning)——Goodfellow、Bengio和 Corville

该书也被称作“花书”,内容很详细且知识新,涵盖你能想到的一切知识点。
两个值得推荐的其它资源:

  • 机器学习的第一门课程(A First Course in Machine Learning, Second Edition (Machine Learning & Pattern Recognition))——Simon Rogers、Mark Girolami
    这本书有第一版和第二版,其中第一版是我得到的第一本书,但我不建议初学者看这本书,但这不妨碍该书是本好书(尤其是第二版)。
  • 机器学习:从概念的角度(Machine Learning: A Probabilistic Perspective )——Kevin Murphy
    该书评价很高,但我没有亲自阅读它,因此没有放在列表中。

总结

除了“花书”以外,我不会推荐从头到尾的阅读。我偏爱于按照主题阅读书籍,即将其作为参考书,当需要清楚哪部分内容时阅读相应的内容。通过阅读以上这些书籍使我觉得自己很谦卑,知道的很少,而机器学习和数据科学领域是多么的广阔。
书籍是永恒的,也是不会抛弃自己的朋友,一直在那里等着你去相遇、相识。Vladimir Vapnik现在已经81岁高龄,Duda这本书首次出版与1973年,我估计50年后,这个行业的从业者仍将阅读它们,就像经受住时间考验的老朋友一样。这展示了基于数学方法的寿命,永不褪色和凋零!

数十款阿里云产品限时折扣中,赶紧点击领劵开始云上实践吧!

作者信息

Ajit Jaokar,数据科学家、教师
个人主页:https://www.linkedin.com/in/ajitjaokar/
本文由阿里云云栖社区组织翻译。
文章原标题《7 Books to Grasp Mathematical Foundations of Data Science and Machine Learning》,译者:海棠,审校:Uncle_LLD。
文章为简译,更为详细的内容,请查看原文

相关文章
|
2月前
|
机器学习/深度学习 测试技术
阿里云入选Gartner数据科学和机器学习平台挑战者象限
Gartner® 正式发布了《数据科学与机器学习平台魔力象限》报告(Magic Quadrant™ for Data Science and Machine Learning Platforms),阿里云成为唯一一家入选该报告的中国厂商,被评为“挑战者”(Challengers)。
|
1月前
|
机器学习/深度学习 数据采集 数据可视化
Python数据科学实战:从Pandas到机器学习
Python数据科学实战:从Pandas到机器学习
|
1月前
|
机器学习/深度学习 数据可视化 数据处理
掌握Python数据科学基础——从数据处理到机器学习
掌握Python数据科学基础——从数据处理到机器学习
44 0
|
4月前
|
机器学习/深度学习 API 网络架构
"解锁机器学习超级能力!Databricks携手Mlflow,让模型训练与部署上演智能风暴,一触即发,点燃你的数据科学梦想!"
【8月更文挑战第9天】机器学习模型的训练与部署流程复杂,涵盖数据准备、模型训练、性能评估及部署等步骤。本文详述如何借助Databricks与Mlflow的强大组合来管理这一流程。首先需在Databricks环境内安装Mlflow库。接着,利用Mlflow跟踪功能记录训练过程中的参数与性能指标。最后,通过Mlflow提供的模型服务功能,采用REST API或Docker容器等方式部署模型。这一流程充分利用了Databricks的数据处理能力和Mlflow的生命周期管理优势。
185 7
|
5月前
|
机器学习/深度学习 数据采集 存储
在机器学习和数据科学中,数据预处理是一个至关重要的步骤。数据规范化(或称为特征缩放)是预处理的一种常见技术,它可以帮助我们改进模型的性能。`sklearn.preprocessing`模块提供了多种数据规范化的方法,其中`StandardScaler`和`MinMaxScaler`是最常用的两种。
在机器学习和数据科学中,数据预处理是一个至关重要的步骤。数据规范化(或称为特征缩放)是预处理的一种常见技术,它可以帮助我们改进模型的性能。`sklearn.preprocessing`模块提供了多种数据规范化的方法,其中`StandardScaler`和`MinMaxScaler`是最常用的两种。
|
6月前
|
机器学习/深度学习
技术心得:机器学习的数学基础
技术心得:机器学习的数学基础
44 0
|
7月前
|
机器学习/深度学习 算法 数据处理
从数据科学到机器学习的过渡:技术与思维的演进
【5月更文挑战第21天】本文探讨了从数据科学到机器学习的过渡,强调了技术与思维的转变。数据科学侧重数据处理和分析,为机器学习提供基础;机器学习是数据科学的强大力量,涉及算法开发。过渡需掌握机器学习算法、编程语言(如Python)及库,转变思维方式,注重预测和优化分析。建议包括深入学习算法、实践项目、掌握编程工具和保持好奇心。这一过渡是职业发展的重要步骤。
|
6月前
|
机器学习/深度学习 算法 搜索推荐
【机器学习】近邻类模型:KNN算法在数据科学中的实践与探索
【机器学习】近邻类模型:KNN算法在数据科学中的实践与探索
114 0
|
6月前
|
机器学习/深度学习 数据采集 算法
踏上机器学习之路:探索数据科学的奥秘与魅力
踏上机器学习之路:探索数据科学的奥秘与魅力
53 0
|
7月前
|
机器学习/深度学习 数据可视化 数据挖掘
《Python 简易速速上手小册》第9章:数据科学和机器学习入门(2024 最新版)
《Python 简易速速上手小册》第9章:数据科学和机器学习入门(2024 最新版)
70 1