SPSS用多元逐步回归模型对上证指数预测、描述统计和相关分析可视化研究

简介: SPSS用多元逐步回归模型对上证指数预测、描述统计和相关分析可视化研究

本文主要思路为了准确的估计股票价格,了解股票的一般规律,更好的为资本市场提供参考意见和帮助股民进行投资股票作出正确的决策,本文从股票价格指数与整个经济环境角度出发,使用SPSS软件采用多元回归分析方法,应用月度时间序列数据,通过选取综合反映股票市场上所有公司股票价格整体水平的指标建立了线性回归模型,得出了股票价格趋势变动的影响因素点击文末“阅读原文”获取完整代码数据

相关视频

image.png

image.png

为大致了解股票价格与诸因素之间的关系,先分别绘制股票价格与各个因素之间的散点图,并分析它们之间的关系.股价用上证A股指数来表示,这样可以减少人为因素对股票价格的影响,尽量将注意力集中在我们假设选用的自变量上。

描述统计和相关分析

获取上证指数数据,货币供应量,消费价格指数人民币美元汇率和存款利率数据。

从下面的表格中可以看到,各个变量的最大最小值平均值以及标准差。

45100faa3573f38ff8feaf3e6ee7b7b4.png

从上面的描述统计分析结果,我们可以看到所有变量有效值都是43个,存在两个缺失。因此我们在后续的分析中可以将其剔除。同时我们可以看到它们的标准差均值、中位数的信息。接下来我们看一下每个变量的分布情况。

ca0474aeef340a391bd77e2353c4256a.png 74e782866f3b6e4663a5fb81124ff942.png

963efeb5c433834b12a93dcec09b0192.png

d83c482644a04a84b9b89ee1771ab672.png

17eb3002decd03bdef798fdd2dd1d4ef.png

从上面的图中我们可以看到美元汇率、人民币存款利率变量分布符合正态分布,而其他变量的分布近似于正态分布。

然后我们可以通过绘制变量之间的散点图来分析各个变量之间的相关关系。

600c72a86dd42f34aab22b75c1a15210.png 673047c2238407d0504010b1e8967ebe.png

71a42cf0b9d37a8eec69d7ff72e230b6.png

4eb68fde5654c279203793cebf62490c.png 7cf390c68740d81a6663b23e15bac0fb.png 从各个变量之间的散点图和相关系数矩阵的结果来看之间的散点图和相关系数矩阵的结果来看美元汇率和货币供应量数据之间存在着显著的负相关关系,人民币存款利率和货币供应量数据之间存在着显著的正相关关系,货币供应量数据和消费价格指数之间也存在着显著的正相关关系。

进行多元回归模型并进行分析

回归指研究一组随机变量(Y1 ,Y2 ,…,Yi)和另一组(X1,X2,…,Xk)变量之间关系的统计分析方法,又称多重回归分析。通常前者是因变量,后者是自变量。

d0f6168d638a422448156cce368123af.png a8a541f04f90dbe1bb804c3fcdad0e11.png

回归结果分析

从输出结果可以看出,回归方程为:上证指数=-34570.5+0.003货币供应量+13.407居民消费价格指数+47.867美元汇率+786.95人民币存款, 除了居民消费价格指以外由对应的值都比显著性水平0.05小,可得两个偏回归系p数在显著性水平0.05下均显著不为零。可决系数R,修正的可决系数R为0.48左右说明方程的拟合效果较好。

从各个变量的回归系数,我们可以判断,货币供应量每增加一个单位上证指数会增加0.003个单位,同样的居民消费指数增加一个单位上证指数会增加13.407个单位。因此,他们对上证指数都有正向影响,同样的,我们可以看到美元汇率和人民币存款上证指数都有正向的影响。因此可以认为他们对上证指数有显著的正向影响。

同时我们看到R方在0.963左右,因此可以认为该模型大部分已经被自变量解释了。但仍存在提高的空间,因此我们后续对该模型进行逐步回归分析。

拟合效果图形展示

以上证指数的原始数据作为x轴,回归拟合值为轴作图。

afb1742d10439107148b1062d39aff90.png

残差分析

残差分析可以对回归模型的假设条件即随机误差项是否独立同分布进行检验,同时还可以找出离群点。显示结果如下:

019826e987fb48712d69e1d1d382efd1.png

d77dc22d12c00b6cc4695ca12fdac258.png

5352c4b5cfc67015410be212fc8f47f3.png

从拟合值与残差的散点图上可以发现,除去离群点外,所有点基本上是随机地分散在纵坐标值为-1和+1的两条平行线之间,这说明随机误差项具有同方差性;拟合值与残差的标准差的散点图,其意义与上面类似;图表明随机误差项是服从正态分布的,其原因是正态Q-Q图近似地可以看成一条直线;右下图的CooK距离图进一步证实有一个离群点,它对回归方程的影响是比较大的,要根据具体问题,讨论出现这一观测值的实际背景。

逐步回归优化

使用逐步回归法建立“最优”的回归方程:

b2bbf52f17e03532d934cd264c71f9b9.png

b2bbf52f17e03532d934cd264c71f9b9.png

977781fc403391ca2cda1737077e4ca6.png

上面用“逐步向前向后回归法”,通过软件分析建立“最优”回归方程。向后回归法就是建立包含全部因子的回归方程,通过回归系数的检验,从回归方程中逐个剔除不显著的因子,直到留在方程中的因子都是显著的。同时可以看到可判别系数的值0.62,因此模型拟合程度较好。

同时可以得到回归方程为:上证指数=-11799.13+12.039美元汇率+63.13居民消费价格指数。

最后我们得到了下面结果文件:

eb217f15a2f1b2e44709df25806de9a4.png

9d7423e6f708a78c5506f6aa933a7e99.png

结论

本文首先通过绘制上证指数与诸影响因素(货币供应量,居民消费价格指数,人民币兑美元汇率,人民币短期存款利率)之间的散点图和计算它们之间的相关系数,可知上证指数与诸因素之间存在比较明显的非线性关系,因此,为简化问题,通过SPSS软件,采用逐步进入法剔除了不显著的自变量—居民消费价格指数、人民币短期存款利率和人民币兑美元汇率,并建立了多元回归模型.利用所得模型可对股票价格的因素进行探讨。

目录
打赏
0
0
0
0
114
分享
相关文章
【SPSS】回归分析详细操作教程(附案例实战)(下)
【SPSS】回归分析详细操作教程(附案例实战)
1306 0
使用LM Studio在本地运行LLM完整教程
GPT-4被普遍认为是最好的生成式AI聊天机器人,但开源模型一直在变得越来越好,并且通过微调在某些特定领域是可以超过GPT4的。
5825 1
一文读懂大规模图神经网络平台AliGraph
2019阿里云峰会·上海开发者大会于7月24日盛大开幕,本次峰会与未来世界的开发者们分享开源大数据、IT基础设施云化、数据库、云原生、物联网等领域的技术干货, 共同探讨前沿科技趋势。本文整理自开源大数据专场中阿里巴巴资深技术专家李永先生的精彩演讲,将为大家分享AliGraph:大规模图神经网络平台。
8715 0
VM虚拟机的配置文件(.vmx)损坏修复
     VM虚拟机中使用.vmx文件保存虚拟机的所有软硬件配置,如果意外损坏的话将会出现不能正常打开虚拟机的故障,症状为:用文本查看软件打开虚拟机目录中的.vmk文件发现内容变为乱码(正常为可读文本,显示虚拟机中的配置信息)修复方法:    本方法仅适用.vmx文件损坏而其他文件完好无损的情况。
5770 0
【赵渝强老师】Hive的分区表
Hive的分区表与Oracle、MySQL类似,通过分区条件将数据分隔存储,提高查询效率。本文介绍了静态分区表和动态分区表的创建与使用方法,包括具体SQL语句和执行计划分析,附带视频讲解。静态分区表需显式指定分区条件,而动态分区表则根据插入数据自动创建分区。
724 1
2024阿里云双11优惠活动开启,云服务器79元一年起,能领代金券和上云补贴金
2024年阿里云双11优惠活动开启,云服务器低至79元一年起,涵盖云数据库、对象存储OSS、无影云电脑等产品,提供代金券、企业算力补贴及上云扶持金等多项优惠,助您轻松上云。
淘宝商品评论数据爬取:Python实战指南
淘宝商品评论数据的自动爬取可以为市场分析和用户行为研究提供宝贵的信息资源。然而,这一过程需要严格遵守法律法规,尊重数据的版权和隐私。通过合理利用Python的网络爬虫技术,可以在遵循道德规范的前提下,高效地完成数据采集任务。 通过本文的指南,希望你能对淘宝商品评论数据的爬取有一个清晰的认识,并能够安全、合法地进行数据采集。
【SPSS】回归分析详细操作教程(附案例实战)(上)
【SPSS】回归分析详细操作教程(附案例实战)
6997 0
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问