AI工程师必读的10本ML读物(附PDF下载)-阿里云开发者社区

开发者社区> 数据派> 正文
登录阅读全文

AI工程师必读的10本ML读物(附PDF下载)

简介: 介绍 你嗜书如命却囊中羞涩?很多机器学习与数据科学书籍的价格都令人退避三舍。其实这也无可厚非,毕竟是作者呕心沥血、卧薪尝胆换来的硕果。 然而,这些作者中也不乏善良仁爱之士,将其作品无偿分享给他人。这对于那些有志成为数据科学家和AI工程师的人,似如获至宝。

介绍

你嗜书如命却囊中羞涩?很多机器学习与数据科学书籍的价格都令人退避三舍。其实这也无可厚非,毕竟是作者呕心沥血、卧薪尝胆换来的硕果。

然而,这些作者中也不乏善良仁爱之士,将其作品无偿分享给他人。这对于那些有志成为数据科学家和AI工程师的人,似如获至宝。

以下附上机器学习方向的电子书10本,均可免费获取。书单方面,我们先引入统计学基础类书籍,随后是机器学习原理类,最后介绍机器学习进阶类。

统计类

统计思维——程序员必备的概率与统计知识

Think Stats –Probability and Statistics for Programmers

c90b45c03f71bd81d4d02c548c1427a379669751

作者:Allan B. Downey

《统计思维》是一本关于概率与统计知识的入门书,它主要针对Python编程的初学者。本书基于Python库中的概率分布(质量函数和累积分布函数)所著。为了便于初学者学习,此书的编程练习大都简短易懂。此外,该书还使用了美国卫生研究院的数据作为案例进行研究。

《统计思维》的亮点之一就是涵盖了贝叶斯统计学的基础知识,对于任何有着雄心壮志的数据科学家来说,这无疑是非常重要的一类学科知识。

贝叶斯推理与机器学习

Bayesian Reasoning and Machine Learning

6e5a9169436cb568c5ca355caec5ae7a2dc2788b

作者: David Barber

《贝叶斯推理与机器学习》是一本关于贝叶斯统计的典范之作。该书引入贝叶斯统计方法来解决机器学习问题。对于任何希望投身机器学习领域的学习者来说,此书都值得一读。

机器学习与统计学基础类

统计学习方法概论

An Introduction to Statistical Learning

53efb09ef81bf79417442a75df390b764fe1912e

作者: Gareth James, Daniela Witten, TrevorHastie and Robert Tibshirani

《统计学方法概论》是本书单最受欢迎的入门读物之一。它从机器学习的角度对数据科学进行了介绍。本书介绍了关于如何使用统计计算与机器学习的方法,为刚刚进入机器学习领域的初学者提供了明确清晰的指导。此外,本书还囊括了诸多应用实例与算法解析。对于那些青睐R编程的学习者,本书也有实例介绍。如果你不是程序员,可千万别被这本书吓倒。无论如何,这本书堪比无价之宝。

有偿中文版 http://download.csdn.net/download/majinlei121/9658748

机器学习入门

Understanding Machine Learning

15b5577a7ee7c636aa58f847c4550ad36be797ac

作者: Shai Shalev-Shwartz and Shai Ben-David

《机器学习入门》系统介绍了机器学习的知识体系,并重点介绍了机器学习的基本理论与数学推导。这些数学推导可将理论转化为应用算法。除此之外,《机器学习入门》还罗列了一个机器学习算法表。包括(且不限于)随机梯度下降、神经网络以及结构输出学习等知识。

程序员数据挖掘导论

AProgrammer’s Guide to Data Mining

09ed861e9be26896cc45fc3a8068c80c62a17fab

作者: RonZacharski

我个人青睐这本书中介绍推荐系统的几个章节。它以有趣、具象且娱乐的角度来看待社交过滤和基于项目的过滤方法以及如何应用机器学习得以实现目标。本书还介绍了朴素贝叶斯和聚类分析的内容。书中还有一章介绍了非结构文本及其处理方法,是为那些打算学习自然语言处理的学习者而准备的。

本书还提供了基于Python的例题便于学习者进行练习。

海量数据集挖掘

Miningof Massive Datasets

33aa0c867082a3a54350a09377e022c1f1e97f09

作者:Anand Rajaraman and Jeffrey David Ullman

随着大数据时代的到来,通过挖掘数据来获取可操作的见解已成为备受追捧的技能。本书重点介绍了曾用于解决数据挖掘中关键问题的一些算法,该算法甚至可用于处理庞大的数据集。

机器学习进阶

神经网络简介

A Brief Introduction to Neural Networks

288d5e5eb60a7f15aa45a20b3359838758df5241

作者:David Kriesel

如果你对神经网络兴致浓厚,那么这本书就是为你而写的。《神经网络简介》首先讲述了神经网络历史,随后又深入探讨并研究了不同类型的神经网络数学模型与解释。此书的读者需要具备一定的线性代数与微积分的基础知识。

深度学习

DeepLearning

92bcc9b7f3fbbd3feac3ed30e348feabc785a8e8

作者: IanGoodfellow, Yoshua Bengio and Aaron Courville

本书是一本由一众深度学习领域的大咖撰写的最全面的深度学习读本。书中具体阐述了诸如蒙特卡罗方法,递归与递归网络,自动编码器和深度生成模型等概念。

(有中文版(draft))

用Python处理自然语言

Natural Language Processing with Python

de7c4c643ec7f3b7a6393fe3869db98fd7ee46b6

作者: StevenBird, Ewan Klein, and Edward Loper

对自然语言处理有浓厚兴趣的读者应该读读这本书。本书内容清晰明了,拥有极为漂亮的Python代码段落。本书还为读者提供了注释清楚易懂的数据集,用以分析并理解非结构化数据,文本中的语言结构以及其他自然语言处理问题。

(本书有中文版PDF)

机器学习憧憬

MachineLearning Yearning

ea6d5ab421dba03d0678d59bb6617823d429bf47

作者: AndrewNg

任何机器学习的书单中少了Andrew Ng的著作都是不完整的。本书将帮助读者快速构建AI系统。通过这本书读者将很快学会如何做出组织机器学习项目所需的各种决策。

本书仍然在定期更新,读者可以在每个章节发布后在网站上注册以获取更新。

我们希望这个书单可以帮到你,如果你还读过或者打算阅读一些其他与机器学习有关的免费书籍,欢迎留言给我们。


原文发布时间为:2018-03-13

本文作者:PRANAVDAR

本文来自云栖社区合作伙伴“数据派THU”,了解相关信息可以关注“数据派THU”微信公众号

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
+ 订阅

官网链接