数据科学

简介: 作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明。谢谢!    数据科学最近成为计算机的热门领域。数据科学是利用计算机的运算能力对数据进行处理,从数据中提取信息,进而形成“知识”。

作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明。谢谢! 

 

数据科学最近成为计算机的热门领域。数据科学是利用计算机的运算能力对数据进行处理,从数据中提取信息,进而形成“知识”。它已经影响了计算机视觉、信号处理、自然语言识别等计算机分支。数据科学已经在IT、金融、医学、自动驾驶等领域得到广泛使用。(如果你熟知中情局的棱镜泄密事件,你会发现数据科学已经在情报领域广泛使用。)

 

在这系列文章中,我希望能完成从概率论,统计,到机器学习的整个数据分析的链条。传统意义上的数据处理是用统计方法实现的,而概率论是统计的基础。随着计算机处理能力的增强,一些需要大量运算的数据分析方法得到快速发展。机器学习实际上是一个混合体,包括一些在计算机领域中发展的算法,也包括一些传统统计中已经存在,但受限于计算能力的统计方法。另一方面,从数据中提炼知识是机器学习的主要目的,这与统计推断密切相关。因此,从传统的概率和统计出发,更容易理解机器学习的内涵。

当然,这样做的困难之处是要覆盖许多内容。严格的叙述有时会显得比较无聊。我会尽力引入实用的编程例子,以便能形成更好的触觉。编程工具会以Python语言为主,配以第三方的包,如Numpy, Scipy, Matplotlib, scikit-learn。统计和机器学习同样可以在其他语言中实现,比如Matlab和R语言。如果你熟悉相应的工具,不难写出类似功能的代码。

 

概率论

计数

概率公理

条件概率

随机变量

离散分布

连续分布

联合分布

随机变量的函数

期望

方差与标准差

协方差与相关系数

矩与矩生成函数

中心极限定律

数学与编程:“概率论”总结

 

统计基础

统计概述

数据描述

 

参数估计

区间估计

假设检验

线性回归

ANOVA

无参估计

贝叶斯方法

 

多变量数据

线性代数01 线性的大脑

PCA分析

 

时序分析

信号与频谱

 

机器学习

聚类算法

神经网络

马科夫链

 

绘图工具

1) matplotlib:

matplotlib核心剖析 

 

参考书籍

豆列

 

目录
相关文章
|
10月前
|
算法 数据挖掘 API
【数据科学基础】学习笔记
数据科学基础与数据挖掘
137 0
|
11月前
|
机器学习/深度学习 人工智能 数据可视化
【数据科学】反思十年数据科学和可视化工具的未来
【数据科学】反思十年数据科学和可视化工具的未来
|
11月前
|
机器学习/深度学习 人工智能 算法
【数据科学】数据科学难题,怎么解释到底什么是数据科学
【数据科学】数据科学难题,怎么解释到底什么是数据科学
|
11月前
|
机器学习/深度学习 人工智能 算法
数据科学难题,怎么解释到底什么是数据科学
数据科学难题,怎么解释到底什么是数据科学
|
机器学习/深度学习 人工智能 供应链
数据科学的现在与未来
数据科学是截至近年来技术领域中最具热度的方向之一。如果您拥有数据科学或者相关专业的工作经验及学位,那么只要大笔一挥、简历一发,一份薪酬可观的职位就会应手而得。
|
机器学习/深度学习 大数据 数据挖掘
数据科学究竟是什么?
本文是关于数据科学的概述和讨论,包括数据挖掘,统计推断,机器学习,数据工程等等。
2307 0
|
数据可视化 Python 数据挖掘
|
机器学习/深度学习 自然语言处理 Python
送你10本机器学习和数据科学必读书
让一系列免费的机器学习与数据科学书籍开启你的夏日学习之旅吧!
2080 0
|
机器学习/深度学习 数据可视化 数据挖掘
数据科学求职建议:掌握5种类型的数据科学项目
本文介绍数据科学求职应该掌握的五个相关项目,以便秋招者对应自身情况查漏补缺。
4418 0
|
机器学习/深度学习 分布式计算 算法
数据科学指南
本文为学习数据科学的指南,从编程语言、数据库管理、数据收集和整理方法、特征工程、机器学习模型、模型评估方面进行讲述。
2757 0

热门文章

最新文章