如何找到时序数据中线性的趋势（一）-阿里云开发者社区

如何找到时序数据中线性的趋势（一）

2022-12-15 88

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 如何找到时序数据中线性的趋势（一）

线性趋势

下面是带有趋势的时序数据:

https://raw.githubusercontent.com/FlorinAndrei/misc/master/qdata.csv

让我们加载它，看看它是什么样子:

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures
from sklearn.metrics import mean_squared_error, r2_scoreser = pd.read_csv('qdata.csv', index_col=0, squeeze=True)
serx
0     473.917764
1       75.324825
2     -306.969479
3       53.271476
4     372.966686
          ...    
95   4650.550473
96   4604.573344
97   4891.704638
98   5265.948162
99   5618.909339
Name: y, Length: 100, dtype: float64plt.plot(ser)
plt.show()

好的，这里有一个趋势。我们假设它是线性的，我们来做线性回归来找出答案。这是线性回归的一个直接应用。上面导入的sklearn库拥有我们进行回归所需要的一切。

X = ser.index
X = np.reshape(X, (len(X), 1))
y = ser.valuesmodel = LinearRegression()
model.fit(X, y)
trend = model.predict(X)plt.plot(y)
plt.plot(trend)
plt.legend(['data', 'trend'])
plt.show()

看起来很合适，但可能不是很合适。让我们从数据中减去趋势，看看非趋势数据是什么样的:

detr = [y[i] - trend[i] for i in range(0, len(y))]
plt.plot(detr)
plt.title('data detrended in a linear fashion')
plt.show()

不是很令人信服。数据中仍有一个凹的趋势。最初的趋势可能不是线性的。

让我们计算数据和我们提取的趋势之间的RMSE和R²。

r2 = r2_score(y, trend)
rmse = np.sqrt(mean_squared_error(y, trend))
print('r2:', r2)
print('rmse', rmse)
r2: 0.8782399672701933
rmse 553.6078593008505

如何找到时序数据中线性的趋势（一）

线性趋势

热门文章

最新文章

相关课程

相关电子书

相关实验场景