MATLAB 数据分析方法(第2版) 1.1 数据分析与MATLAB

简介:

第1章 MATLAB基础 

 MATLAB数据分析方法

 

本章主要介绍MATLAB软件的一些入门知识,包括MATLAB界面及其基本操作、变量与函数、运算符与操作符、矩阵数据的输入与输出、符号运算、M文件与编程等,为读者学习以后各章打下基础。

 

1.1 数据分析与MATLAB


1.1.1 数据分析概述

1.数据分析的概念

 

数据分析是指用适当的统计方法对收集来的数据进行详细研究,提取其中有用信息并形成结论,以求最大化地开发数据的功能,发挥数据的作用。在统计学领域,有人将数据分析划分为描述性数据分析、探索性数据分析以及验证性数据分析。描述性数据分析是描述测量样本的各种特征及其所代表的总体特征,探索性数据分析侧重于在数据之中发现新的特征,验证性数据分析侧重于已有假设的证实或证伪。

数据分析的目的是把隐藏在数据背后的信息集中和提炼出来,总结出研究对象的内在规律。在实际工作当中,数据分析能够帮助管理者进行判断和决策,以便采取适当策略与行动。例如企业通过对产品的市场销售数据分析,可把握当前产品的市场动向,从而制定出今后合理的产品研发和销售计划。

 

2.数据来源与分类

 

数据分析的起点是取得数据。数据是通过实验、测量、观察、调查等方式获取的结果,这些结果常以数量的形式展现出来,因此数据也称为观测值。数据按照不同的标准进行分类,可分为观测数据与试验数据、一手数据与二手数据、时间序列数据与横截面数据等。

 

1)观测数据与试验数据。观测数据是在自然的未被控制的条件下观测到的数据,如社会商品零售额、消费价格指数、汽车销售量、某地区降水量等。利用这类数据进行观测所研究的个体,并度量感兴趣的变量。试验数据是在人工干预和操纵的条件下产生的数据,这种数据通常来自于科学与技术实验。例如,在研究不同的药物成分组成对某种疾病的治疗效果有什么不同时,记录实验药物成分在不同的条件下产生相应的治疗效果数据,那么药物成分数据与治疗效果数据就是试验数据。

 

2)一手数据与二手数据。一手数据是针对特定的研究问题,通过专门收集、调查或试验获得的数据。例如,为制定一家百货商店的营销方案,在这家商店所在城市抽取近300户家庭作为样本进行调查,收集下列数据:对本商店及其竞争对手商店的熟悉程度;家庭成员在各个商店购物的频率;选择百货商店时考虑的因素,如商品质量、种类、退赔政策、服务、价格、店址、商店布局、信用与收款政策;每个商店的偏好评分;被调查者的年龄、性别、受教育程度等。二手数据是由各种媒体、机构等发布的数据,数据分析人员可以根据研究的问题,从这些数据中加以选择,如证券市场行情、物价指数、耐用消费品销售量、利率、国内生产总值、进出口贸易数据等。

 

3)时间序列数据与横截面数据。时间序列数据是对同一研究对象按时间顺序收集得到的数据,这类数据反映某一事物、现象等随时间的变化状态或程度。例如,2005年至2014年中国人均国内生产总值指数(上年=100)数据分别为:110.7,112.1,113.6,109.1,108.7,110.1,109.0,107.2,107.2,106.7(数据来源:《中国统计年鉴2014》)。同样,某商场每日销售额、某股票每日收盘价、沪深股市每日收盘指数等都是时间序列数据。

 

横截面数据是在同一时间、不同统计单位、相同统计指标组成的数据列,这类数据体现的是个体的个性,突出个体的差异。例如,某日沪市全部交易股票的当日收盘价数据、2014年中国31省市人均国内生产总值增长率数据都是横截面数据。

 

近年来,出现了将横截面数据和时间序列数据合并起来进行研究的数据类型,称为面板数据(Panel Data)。该数据具有横截面和时间序列两个维度,当这类数据按两个维度进行排列时,数据都排在一个平面上,与排在一条线上的一维数据有着明显的不同,整个表格像是一个面板。该类数据模型可以分析个体之间的差异情况,又可以描述个体的动态变化特征。例如,每年各地区的国内生产总值增长率数据;在一定时期间隔内对同一地区同样的家庭进行调查,以观察其住房和经济状况是否有变化,这样得到的数据都是面板数据。

 

3.数据分析过程

 

数据分析过程包括确定数据分析的目标、研究设计、收集数据、分析数据、解释结果。

 

1)确定数据分析的目标。数据分析的目标是分析和解决特定的领域问题,而这个问题可以用量化分析的方法来解决。

 

2)研究设计。研究设计是根据数据分析的目标寻求解决方案。一般而言,数据分析是用量化分析的方法对现象进行描述、解释、预测与控制。一个特定的领域问题要转化为数据分析问题,首先要进行量化研究设计,确定用什么量化研究方法以及怎样研究。常用的量化研究方法有调查法(用调查或观测得到的样本数据推断总体)、相关研究法、实验法、时序分析法等。

 

3)收集数据。确定了所要解决的问题的研究设计后,根据所要采用的量化研究方法收集数据。例如,若采用调查法,需要确定具体抽样方法以获取数据;若采用实验法,需要进行实验设计,通过实验来获取数据等。这些是为所要解决的问题专门收集的一手数据。除此之外,通常还需要二手数据。

 

4)整理与分析。数据整理与数据分析即利用数据分析方法进行计算和分析。数据分析方法以统计分析技术为主,借助各种软件(SPSS、SAS、Excel、S-Plus等)工具,完成数据的计算分析任务。本书以MATLAB为工具进行计算。

 

5)解释和分析计算结果。使用各种方法与软件等工具计算后,会得到一系列结果,包括各种图表、数据等。说明、解释和分析这些结果,或利用计算结果检验各种假设、预测、控制等,从而最终解决所要研究的问题。最后提交数据分析报告,供决策时参考。

 

1.1.2 MATLAB在数据分析中的作用

 

MATLAB是一套高性能的数值计算和可视化软件,它集矩阵运算、数值分析、信号处理和图形显示于一体,构成了一个界面友好、使用方便的用户环境,是实现数据分析与处理的有效工具,其中MATLAB统计工具箱更为人们提供了一个强有力的统计分析工具。

 

选择MATLAB软件作为数据分析工具,不仅节约了数据分析过程中的计算时间,而且增加了统计推断的正确性,提高了数据分析的效率。但要注意,尽管软件对数据分析起到非常大的作用,但软件不能处理数据分析中所有阶段所要解决的问题。明确这一点后可以更好地使用软件。确定数据分析的目标、对问题的研究设计、选择统计分析方法、收集数据、解释和分析计算结果,这些都不是软件所能替代解决的。

 

本书介绍数据分析的基本理论方法,应用MATLAB编写程序进行数据分析,既面向过程又面向对象。为方便读者,以下对MATLAB的基本操作方法作比较系统的介绍。

 

相关文章
|
2月前
|
算法 数据安全/隐私保护 计算机视觉
基于二维CS-SCHT变换和LABS方法的水印嵌入和提取算法matlab仿真
该内容包括一个算法的运行展示和详细步骤,使用了MATLAB2022a。算法涉及水印嵌入和提取,利用LAB色彩空间可能用于隐藏水印。水印通过二维CS-SCHT变换、低频系数处理和特定解码策略来提取。代码段展示了水印置乱、图像处理(如噪声、旋转、剪切等攻击)以及水印的逆置乱和提取过程。最后,计算并保存了比特率,用于评估水印的稳健性。
|
15天前
|
算法 数据挖掘
MATLAB数据分析、从算法到实现
MATLAB数据分析、从算法到实现
|
25天前
|
算法 vr&ar
基于自适应波束成形算法的matlab性能仿真,对比SG和RLS两种方法
```markdown - MATLAB2022a中比较SG与RLS自适应波束成形算法。核心程序实现阵列信号处理,强化期望信号,抑制干扰。RLS以其高效计算权重,而SG则以简单和低计算复杂度著称。[12345] [6666666666] [777777] ```
|
24天前
|
算法 安全 数据挖掘
随机数生成方法及其在Matlab中的应用
随机数生成方法及其在Matlab中的应用
|
2月前
|
算法 数据安全/隐私保护 C++
基于二维CS-SCHT变换和扩频方法的彩色图像水印嵌入和提取算法matlab仿真
该内容是关于一个图像水印算法的描述。在MATLAB2022a中运行,算法包括水印的嵌入和提取。首先,RGB图像转换为YUV格式,然后水印通过特定规则嵌入到Y分量中,并经过Arnold置乱增强安全性。水印提取时,经过逆过程恢复,使用了二维CS-SCHT变换和噪声对比度(NC)计算来评估水印的鲁棒性。代码中展示了从RGB到YUV的转换、水印嵌入、JPEG压缩攻击模拟以及水印提取的步骤。
|
28天前
|
机器学习/深度学习 数据可视化 算法
探索MATLAB世界:掌握基础知识与实用技能(1. MATLAB环境与基本操作 2. 数据类型与变量 3. 条件与循环,1. 数据分析与统计 2. 图像处理与计算机视觉 3. 信号处理与控制系统)
探索MATLAB世界:掌握基础知识与实用技能(1. MATLAB环境与基本操作 2. 数据类型与变量 3. 条件与循环,1. 数据分析与统计 2. 图像处理与计算机视觉 3. 信号处理与控制系统)
19 0
单向/双向V2G环境下分布式电源与电动汽车充电站联合配置方法(matlab代码)
单向/双向V2G环境下分布式电源与电动汽车充电站联合配置方法(matlab代码)
基于纳什谈判理论的风–光–氢多主体能源系统合作运行方法(含matlab代码)
基于纳什谈判理论的风–光–氢多主体能源系统合作运行方法(含matlab代码)
|
2月前
|
调度
考虑充电负荷空间可调度特性的分布式电源与电动汽车充电站联合配置方法(matlab代码)
考虑充电负荷空间可调度特性的分布式电源与电动汽车充电站联合配置方法(matlab代码)

热门文章

最新文章