数据科学

简介: 作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明。谢谢!    数据科学最近成为计算机的热门领域。数据科学是利用计算机的运算能力对数据进行处理,从数据中提取信息,进而形成“知识”。

作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明。谢谢! 

 

数据科学最近成为计算机的热门领域。数据科学是利用计算机的运算能力对数据进行处理,从数据中提取信息,进而形成“知识”。它已经影响了计算机视觉、信号处理、自然语言识别等计算机分支。数据科学已经在IT、金融、医学、自动驾驶等领域得到广泛使用。(如果你熟知中情局的棱镜泄密事件,你会发现数据科学已经在情报领域广泛使用。)

 

在这系列文章中,我希望能完成从概率论,统计,到机器学习的整个数据分析的链条。传统意义上的数据处理是用统计方法实现的,而概率论是统计的基础。随着计算机处理能力的增强,一些需要大量运算的数据分析方法得到快速发展。机器学习实际上是一个混合体,包括一些在计算机领域中发展的算法,也包括一些传统统计中已经存在,但受限于计算能力的统计方法。另一方面,从数据中提炼知识是机器学习的主要目的,这与统计推断密切相关。因此,从传统的概率和统计出发,更容易理解机器学习的内涵。

当然,这样做的困难之处是要覆盖许多内容。严格的叙述有时会显得比较无聊。我会尽力引入实用的编程例子,以便能形成更好的触觉。编程工具会以Python语言为主,配以第三方的包,如Numpy, Scipy, Matplotlib, scikit-learn。统计和机器学习同样可以在其他语言中实现,比如Matlab和R语言。如果你熟悉相应的工具,不难写出类似功能的代码。

 

概率论

计数

概率公理

条件概率

随机变量

离散分布

连续分布

联合分布

随机变量的函数

期望

方差与标准差

协方差与相关系数

矩与矩生成函数

中心极限定律

数学与编程:“概率论”总结

 

统计基础

统计概述

数据描述

 

参数估计

区间估计

假设检验

线性回归

ANOVA

无参估计

贝叶斯方法

 

多变量数据

线性代数01 线性的大脑

PCA分析

 

时序分析

信号与频谱

 

机器学习

聚类算法

神经网络

马科夫链

 

绘图工具

1) matplotlib:

matplotlib核心剖析 

 

参考书籍

豆列

 

目录
相关文章
|
ice
Google Earth Engine ——Landsat 7 影像集合数据集详细介绍
Google Earth Engine ——Landsat 7 影像集合数据集详细介绍
384 1
|
网络架构
ICMP协议(Internet控制消息协议)
本文详细的介绍ICMP协议,内含详细的实例解析,该文你值得拥有。
圆形算法识别
圆形算法识别
|
SQL 关系型数据库 MySQL
MySQL 事务详解
在数据库管理中,事务是一组SQL语句的执行单元,它们被视为一个整体。事务的主要目标是保持数据库的一致性和完整性,即要么所有SQL语句都成功执行,要么所有SQL语句都不执行。在MySQL中,事务起到了非常重要的作用,特别是在需要确保数据的完整性和一致性的应用程序中。 本文将详细介绍MySQL事务的概念、特性、隔离级别、事务的控制和示例代码等内容,以帮助您更好地理解和应用MySQL事务。
520 2
|
4月前
|
前端开发 Java 开发者
MVC 架构模式技术详解与实践
本文档旨在全面解析软件工程中经典且至关重要的 MVC(Model-View-Controller) 架构模式。内容将深入探讨 MVC 的核心思想、三大组件的职责与交互关系、其优势与劣势,并重点分析其在现代 Web 开发中的具体实现,特别是以 Spring MVC 框架为例,详解其请求处理流程、核心组件及基本开发实践。通过本文档,读者将能够深刻理解 MVC 的设计哲学,并掌握基于该模式进行 Web 应用开发的能力。
677 1
|
前端开发 JavaScript 开发者
通义灵码:前端开发的效率助推器
作为一名前端开发者,我近期开始使用通义灵码辅助开发,显著提升了编码效率和质量。在编写复杂交互逻辑或应用新技术框架时,通义灵码能快速提供代码框架和建议,帮助我快速搭建页面架构并解决技术难题,使项目进展更加顺利。其简洁友好的界面和强大的功能,让我的开发工作变得更加高效和自信。
|
监控 JavaScript 数据可视化
FineReport 11 在线学习
FineReport 11 在线学习
282 7
|
机器学习/深度学习 数据可视化 大数据
Python数据可视化的最新趋势
【8月更文挑战第20天】随着数据量激增及洞察需求提升,数据可视化在数据分析领域愈发关键。Python凭借其强大的库支持,已成为数据可视化的重要工具。当前趋势包括交互式可视化(如Bokeh、Plotly)和机器学习驱动的可视化(如Yellowbrick)。未来发展方向涉及:整合增强现实(AR)与虚拟现实(VR)技术,实现更为沉浸式的体验;自动化可视化,借助机器学习简化流程;强化大数据支持,优化处理效率;多模态数据可视化,综合多种类型数据;以及提高可视化工具的互操作性和自适应性,满足跨平台需求。Python将持续引领数据可视化领域的革新与发展。
|
数据可视化
结构方程模型 SEM 多元回归和模型诊断分析学生测试成绩数据与可视化
结构方程模型 SEM 多元回归和模型诊断分析学生测试成绩数据与可视化
|
算法
白盒攻击中FGM、FGSM、DeepFool算法在MNIST手写数字集中的实战(附源码)
白盒攻击中FGM、FGSM、DeepFool算法在MNIST手写数字集中的实战(附源码)
710 0