Python用GARCH对ADBL股票价格时间序列趋势滚动预测、损失、可视化分析

简介: Python用GARCH对ADBL股票价格时间序列趋势滚动预测、损失、可视化分析

全文链接:https://tecdat.cn/?p=33398


金融市场的股票价格时间序列分析一直以来都是投资者和研究者关注的主题之一。准确预测股票价格的趋势对于制定有效的投资策略和决策具有重要意义。因此,许多研究人员使用各种统计方法和模型来分析和预测股票价格的变动点击文末“阅读原文”获取完整代码数据


本文的目标是帮助客户应用GARCH模型对ADBL(ABC Development Bank Limited)股票价格的时间序列进行分析和预测,并通过可视化分析的方式展示结果。ADBL是尼泊尔地区最大的商业银行之一,其股票价格波动对投资者和研究者来说具有重要意义。

首先,我们将收集ADBL股票价格的历史数据,并对其进行描述性统计和可视化分析,以获取对股票价格的初步认识。然后,我们将使用GARCH模型对ADBL股票价格的波动进行建模,并通过模型参数的估计和模型检验来验证模型的适应性。

接下来,我们将利用已建立的GARCH模型对ADBL股票价格的未来走势进行预测。预测结果将以图表和可视化方式呈现,以便读者更加直观地理解和分析。

最后,我们将对模型的预测效果进行评估,并讨论模型的局限性和未来研究的方向。通过本文的研究,我们希望为投资者和研究者提供一个有效的工具和方法,帮助他们更好地理解和预测ADBL股票价格的趋势。

导入库

# 广义自回归条件异方差(GARCH模型)
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
     
plt.rcParams['figure.figsize'] = (12,6)

这段代码的主要作用是导入所需的库和模块,为接下来的数据处理、图表绘制和模型评估等操作提供必要的工具和函数。

导入数据

# df = df[df['Date'] >= '2015-01-01']
df.head()

这段代码主要是导入数据并对数据进行处理的操作。具体而言,代码的功能如下:

  1. pd.read_csv('ADBL_data.csv'): 使用 pandas 库的 read_csv() 函数读取名为 "ADBL_data.csv" 的 CSV 文件,并将数据加载到一个名为 df 的数据框(DataFrame)中。
  2. df['Date'] = pd.to_datetime(df.Date): 将 df 数据框中的 "Date" 列转换为日期时间类型。这里使用 pd.to_datetime() 函数将日期字符串转换为日期时间格式。
  3. # df = df[df['Date'] >= '2015-01-01']: 这一行代码是对数据进行筛选的注释,表示根据日期进行过滤,只保留日期大于等于 "2015-01-01" 的数据。注释符号 # 表示该行代码不会被执行。
  4. df.head(): 打印输出 df 数据框的前几行数据,默认显示前5行。通过调用 head() 方法可以快速查看数据框的结构和内容。

综上所述,这段代码的作用是读取名为 "ADBL_data.csv" 的 CSV 文件,并将其加载到名为 df 的数据框中。然后对数据进行了格式转换并打印出前几行的数据。

image.png

"ADBL的时间序列图"

plt.ylabel("Price")
plt.show()

image.png

点击标题查阅往期内容


R语言股票市场指数:ARMA-GARCH模型和对数收益率数据探索性分析


01

02

03

04



df.reset_index(drop=True, inplace=True)
df

image.png

df.returns.plot() 
plt.show()

image.png

df.returns.describe()

image.png

# "平方股票收益的自相关图"
plot_acf(df.returns**2)
plt.show()

image.png

从ACF图中可以看出,在1个滞后时间步长内,方差存在显著的正相关关系。


识别 p 和 q


# 基于最小AIC确定的最佳p和q项
for p in range(1, 15):
  for q in range(1, 15):
    try:
     
print(f'GARCH order is ({p}, {q})')

image.png

这段代码的主要功能是基于最小化赤池信息准则(AIC)来确定 GARCH 模型的最佳 p 和 q 值。具体而言,代码的执行过程如下:

  1. 创建一个空字典 dict_aic,用于保存每个不同 p 和 q 值组合对应的 AIC 值。
  2. 使用两个嵌套的循环遍历从 1 到 14 的所有整数值。外层循环控制 p 值的范围,内层循环控制 q 值的范围。
  3. 在每次循环迭代中,尝试构建一个 GARCH 模型,其中 vol 参数设为 'Garch',p 参数设为当前的外层循环变量 p,q 参数设为当前的内层循环变量 q。
  4. 如果成功拟合模型,则计算该模型的 AIC 值,并将其保存到 dict_aic 字典中对应的键值对中,键为 (p, q),值为 AIC 值。

综上所述,这段代码的作用是通过遍历多个 p 和 q 值的组合,并拟合 GARCH 模型来计算对应的 AIC 值。然后,基于最小 AIC 值确定最佳的 p 和 q 值,并输出结果。

训练/测试分割

# 将训练集和测试集按照70/30的比例分割
st.shape)

image.png

模型训练

model.summary()

image.png

这段代码的目的是使用 GARCH 模型对训练数据进行拟合,并打印出模型的摘要信息。

具体而言,代码的执行流程如下:

  1. 创建一个 GARCH 模型对象并将其赋值给变量 model,其中 X_train 是作为训练数据的输入。vol='Garch' 表示使用 GARCH 方式进行建模。pq 是 GARCH 模型中的参数,分别表示 ARCH 部分和 GARCH 部分的滞后阶数。

综上所述,这段代码的作用是创建一个 GARCH 模型对象并使用训练数据进行拟合,然后打印出模型的摘要信息,以便查看模型拟合的结果和相关统计指标。

测试集上的滚动预测

# 基于滚动测试集预测波动性。
forecasts = list()
for i in range(X_test.shape[0]):
 
    forecasts.appe

这段代码的目的是基于滚动测试集预测波动性。

具体而言,代码的执行流程如下:

  1. 创建一个空列表 forecasts,用于保存每个时间点的波动性预测结果。
  2. 进行一个循环,循环次数根据测试数据的行数来确定,每次循环表示一个时间点的波动性预测。
  3. 在每次循环迭代中,首先获取用于预测的测试数据。通过 df.returns[:-(X_test.shape[0] - i)] 获取了从开始到当前循环迭代索引位置的训练数据。
  4. 创建一个 GARCH 模型对象,并将预测数据作为输入。模型对象中的 pq 参数由之前确定的值指定。

综上所述,这段代码的作用是在每个时间点上,基于滚动的测试数据来预测波动性。通过一个循环,在每次循环迭代中,根据当前的训练数据来构建 GARCH 模型,并使用该模型进行波动性预测,将预测结果保存在 forecasts 列表中。

损失分析

from sklearn.metri
# 计算均方根误差
testScore = mean_sq

image.png

# 参考训练集最后一个指数的实际收盘价,根据预测收益生成收盘价
# 今日值 = 昨日值 + (pct_returns * 昨日值) / 100
pred_vals = []
for i in range(len(forecasts)):
  if pred_vals:
    pre
# 今日值 = 昨日值 + (pct_returns * 昨日值) / 100
testSco

image.png

date_range = df['Date'][-X_test.shape[0]:]
     
plt.title(
plt.legend(fontsize=14)
plt.show()

image.png

相关文章
|
1月前
|
机器学习/深度学习 数据采集 算法
时间序列结构变化分析:Python实现时间序列变化点检测
在时间序列分析和预测中,准确检测结构变化至关重要。新出现的分布模式往往会导致历史数据失去代表性,进而影响基于这些数据训练的模型的有效性。
48 1
|
2月前
|
机器学习/深度学习 算法 数据挖掘
6种有效的时间序列数据特征工程技术(使用Python)
在本文中,我们将探讨使用日期时间列提取有用信息的各种特征工程技术。
108 0
|
1月前
|
机器学习/深度学习 索引 Python
python之序列
python之序列
139 59
|
22天前
|
机器学习/深度学习 数据采集 算法
数据稀缺条件下的时间序列微分:符号回归(Symbolic Regression)方法介绍与Python示例
有多种方法可以处理时间序列数据中的噪声。本文将介绍一种在我们的研究项目中表现良好的方法,特别适用于时间序列概况中数据点较少的情况。
34 1
数据稀缺条件下的时间序列微分:符号回归(Symbolic Regression)方法介绍与Python示例
|
25天前
|
机器学习/深度学习 测试技术 数据处理
KAN专家混合模型在高性能时间序列预测中的应用:RMoK模型架构探析与Python代码实验
Kolmogorov-Arnold网络(KAN)作为一种多层感知器(MLP)的替代方案,为深度学习领域带来新可能。尽管初期测试显示KAN在时间序列预测中的表现不佳,近期提出的可逆KAN混合模型(RMoK)显著提升了其性能。RMoK结合了Wav-KAN、JacobiKAN和TaylorKAN等多种专家层,通过门控网络动态选择最适合的专家层,从而灵活应对各种时间序列模式。实验结果显示,RMoK在多个数据集上表现出色,尤其是在长期预测任务中。未来研究将进一步探索RMoK在不同领域的应用潜力及其与其他先进技术的结合。
66 4
|
13天前
|
数据挖掘 Python
用python的tushare模块分析股票案例(python3经典编程案例)
该文章提供了使用Python的tushare模块分析股票数据的案例,展示了如何获取股票数据以及进行基本的数据分析。
12 0
|
1月前
|
机器学习/深度学习 数据采集 TensorFlow
使用Python实现智能股票交易策略
使用Python实现智能股票交易策略
33 0
|
2天前
|
安全 Python
Python 高级编程:高效读取 txt 文件的技巧与实践
在 Python 中,读取 txt 文件是常见操作。本文介绍了使用 `with` 语句自动管理文件资源、逐行读取文件、读取特定字节范围内容、处理编码问题以及使用缓冲读取提高性能等高级方法,确保代码高效且安全。通过这些技巧,你可以更灵活地处理文件内容,并避免资源泄漏等问题。原文链接:https://www.wodianping.com/app/2024-10/44183.html
32 18
|
3天前
|
机器学习/深度学习 Linux Python
Python编程教学
Python教学
24 13
|
2天前
|
缓存 Python
Python编程中的装饰器深度探索
本文深入探讨了Python中装饰器的高级用法,从基本定义到实际应用,展示了如何利用装饰器提升代码的灵活性和可维护性。通过具体示例,解析了装饰器在函数增强、日志记录、权限验证等方面的应用,旨在帮助读者彻底理解和掌握这一强大的编程工具。