《数学建模:基于R》——1.1 数据的描述性分析

简介: 本节书摘来自华章计算机《数学建模:基于R》一书中的第1章,第1.1节,作者 薛毅,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.1 数据的描述性分析

在建立随机模型之前,首先要分析数据的主要特征,也就是数据的数字特征.这些特征通常是均值、方差,或者是数据服从什么分布.只有在确定了这些特征之后,才能建立起符合实际的模型.

本节介绍数据的描述性分析的统计方法,以及完成此类分析的R函数.

1.1.1 数据的数字特征

image
image
image
image
image
image
image
image

1.1.2 随机变量的分布

1.随机变量

从一个总体中抽取不同的样本,分析各个样本所获得的点估计往往不尽相同,这种表现出变异性特征的量称为变量.

在进行统计试验以前,一般并不知道某一试验的确切结果,但是可以赋予试验结果以实际数量的一个函数.因此这一变量称为随机变量.随机变量常用大写字母表示,如X,Y,Z.它们可能出现的具体结果或数值则可用小写字母表示,如x,y,z.

最常见的随机变量有两类.一类是以计数形式表示的随机变量,称为离散型随机变量;另一类是取值在某个有限或无限区间的随机变量,称为连续型随机变量.

2.分布函数

image

3.概率函数与概率密度函数

image

4.分位数

image
image

1.1.3 常用的分布

image
image
image
image
image
image
image

1.1.4 数据的图形描述

可以通过数据的图形描述判断数据的分布情况,比如是否来自于正态分布等.

1.直方图

直方图又称柱状图或质量分布图,是一种统计报告图,由一系列高度不等的纵条纹或线段表示数据的分布情况.直方图是用来展示连续数据分布的常用工具,用来估计数据的概率分布.

image

在R中,hist()函数绘制数据的直方图,其使用格式为

image
image
image
image
image
image
image

相关文章
|
9月前
|
自然语言处理 小程序 数据挖掘
数据分析实战-Python实现博客评论数据的情感分析
数据分析实战-Python实现博客评论数据的情感分析
380 0
|
6月前
|
数据挖掘 数据处理
R语言统计基本概念:探索描述性统计与推断统计的奥秘
【8月更文挑战第30天】描述性统计与推断统计是R语言统计分析中的两大基石。描述性统计帮助我们直观地了解数据的分布特征和基本属性,而推断统计则允许我们基于样本数据对总体进行推断和预测。在数据分析的实际应用中,两者相辅相成,共同构成了数据分析的完整框架。掌握这两大概念及其在R语言中的实现方法,对于提升数据分析能力和决策效率具有重要意义。
|
9月前
|
传感器 存储 数据可视化
matlab数据可视化交通流量分析天气条件、共享单车时间序列数据
matlab数据可视化交通流量分析天气条件、共享单车时间序列数据
|
9月前
|
存储 数据挖掘
R语言Kaggle泰坦尼克号性别阶级模型数据分析案例
R语言Kaggle泰坦尼克号性别阶级模型数据分析案例
|
9月前
|
机器学习/深度学习 存储 算法
R语言使用特征工程泰坦尼克号数据分析应用案例
R语言使用特征工程泰坦尼克号数据分析应用案例
|
9月前
|
数据可视化 算法 数据挖掘
Python、R对小说进行文本挖掘和层次聚类可视化分析案例
Python、R对小说进行文本挖掘和层次聚类可视化分析案例
|
9月前
|
机器学习/深度学习 算法 数据挖掘
python数据分析——数据分析的统计推断
数据分析的统计推断是科学研究中的重要环节,它通过对样本数据的分析,对总体参数进行估计,并对假设进行检验。这一过程旨在从数据中提取有意义的信息,为决策提供科学依据。 在统计推断中,我们通常会遇到两类问题:参数估计和假设检验。参数估计是通过样本数据对总体参数进行点估计或区间估计。点估计是对总体参数的具体数值进行预测,而区间估计则是给出一个包含总体参数的置信区间。这两种估计方法都基于大数定律和中心极限定理,保证了估计的准确性和可靠性。
110 0
|
9月前
|
存储 数据可视化 数据挖掘
【数据分析与可视化】时间序列基础讲解与实战(图文解释 附源码)
【数据分析与可视化】时间序列基础讲解与实战(图文解释 附源码)
95 0
数学建模统计分析-典型相关分析
统计分析-典型相关分析
108 0
|
算法 数据挖掘
数学建模统计分析 -- 聚类算法模型
数学建模统计分析 -- 聚类算法模型
153 0

热门文章

最新文章