简介
本书包括对机器学习中常见问题和不常见问题的演练和解决方案,以及如何利用scikit-learn有效地执行各种机器学习任务。
第二版首先介绍评估数据统计属性的方法,并为机器学习建模生成合成数据。当您逐步完成这些章节时,您会遇到一些食谱,它们将教您实施数据预处理,线性回归,逻辑回归,KNN,NaïveBayes,分类,决策树,合奏等技术。
此外,您将学习使用多级分类,交叉验证,模型评估来优化您的模型,并深入学习使用scikit-learn实现深度学习。
除了涵盖模型部分,API和分类器,回归器和估算器等新功能的增强功能外,本书还包含评估和微调模型性能的方法。在本书的最后,您将探索用于Python的scikit-learn提供的众多功能,以解决您遇到的任何机器学习问题。
参考资料
- 下载:https://www.jianshu.com/p/c2f5d948abe6
- 本文最新版本地址
- 本文涉及的python测试开发库 谢谢点赞!
- 本文相关海量书籍下载
- 2018最佳人工智能机器学习工具书及下载(持续更新)
内容
1:高性能机器学习 - NUMPY
2:预模型工作流程和预处理
3:减少尺寸
4:SCIKIT-LEARN线性模型
5:线性模型 - 逻辑回归
6:具有距离度量的模型
7:交叉验证和后模型工作流程
8:支持矢量机
9:树算法和插件
10:具有SCIKIT-LEARN的文本和多层分类
11:神经网络
12:创建简单的估计器
你将学到什么
- 使用scikit-learn在几分钟内构建预测模型
- 理解分类和回归之间的差异和关系,两种类型的监督学习。
- 使用距离度量来预测聚类,这是一种无监督学习
- 找到与Nearest Neighbors具有相似特征的点。
- 使用自动化和交叉验证来查找最佳模型,并专注于数据产品
- 选择众多最佳算法或在整体中一起使用它们。
- 使用sklearn的简单语法创建自己的估算器
- 探索scikit-learn中提供的前馈神经网络
作者
- 朱利安.阿维拉
Julian Avila是金融和计算机视觉领域的程序员和数据科学家。他毕业于麻省理工学院(MIT)数学专业,研究量子力学计算,涉及物理,数学和计算机科学。在麻省理工学院期间,朱利安首先通过与CSAIL实验室的朋友讨论,获得古典和弗拉门戈吉他,机器学习和人工智能。
他开始在中学编程,包括游戏和几何艺术动画。他成功地参加了数学和编程,并在麻省理工学院的几个小组工作。 Julian用优雅的Python编写了完整的软件项目,并进行了即时编译。他的一些令人难忘的项目包括大型面部识别系统,用于GPU上的神经网络视频,识别图片中的神经元部分,及股票市场交易程序。
- 特伦特.豪克
Trent Hauck是一位在西雅图地区生活和工作的数据科学家。他在堪萨斯州的威奇托长大,并获得了堪萨斯大学的本科和研究生学位。他是“使用pandas How-to,Packt Publishing”这本书的即时数据密集型应用程序的作者,这本书可以帮助您快速掌握pandas和其他相关技术。