时间序列分析中的互相关与相干性分析:前导-滞后关系的理论基础与实际应用

本文涉及的产品
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
实时计算 Flink 版,5000CU*H 3个月
实时数仓Hologres,5000CU*H 100GB 3个月
简介: 时间序列数据在现代数据分析中广泛应用,从金融市场到生物医学领域。本文重点介绍两种分析工具:互相关和相干性分析。互相关用于量化两个时间序列的时域关系,揭示前导-滞后关系;相干性分析则评估信号在频率域的相关性,适用于脑电图等研究。通过实际案例和Python代码示例,展示了这两种方法的应用价值。

时间序列数据在现代数据分析中无处不在。从金融市场的股票价格波动到生物医学领域的心电图与脑电图信号,甚至是日常生活中的用水量变化,都可以通过时间序列来表征。深入理解时间序列信号之间的关联性对于提取有意义的数据特征至关重要。本文将重点介绍两种基本但强大的分析工具:互相关相干性分析。这些方法能够有效地揭示信号之间的内在关系,既可以用于识别前导-滞后关系,也可以用于检测频率域上的共振特性

互相关分析:时域关系解析

互相关是一种用于量化两个时间序列信号之间相似度的数学工具,其计算基于对一个信号施加时间延迟。通过互相关分析,可以确定一个信号是否在时间上"前导"或"滞后"于另一个信号,并量化它们在时间轴上的对齐程度。

从数学角度而言,两个时间序列x(t)y(t)之间的互相关函数定义如下:

互相关函数的数学表达式

公式分析:

以下我们将通过分析苹果公司(AAPL)微软公司(MSFT)的股票价格来演示互相关分析的应用。

我们将使用

yfinance

库获取实际的股票市场数据。分析目标是通过考察不同时间延迟下的互相关性,确定微软(MSFT)股价变动是领先于还是滞后于苹果(AAPL)的股价变动。

 importyfinanceasyf  
 importmatplotlib.pyplotasplt  
 importnumpyasnp  

 # 从Yahoo Finance获取指定时间段的股票数据 
 start_date="2019-01-01"  
 end_date="2024-01-01"  

 # 提取AAPL和MSFT的收盘价数据  
 aapl=yf.download("AAPL", start=start_date, end=end_date)['Adj Close']  
 msft=yf.download("MSFT", start=start_date, end=end_date)['Adj Close']  

 # 对数据进行标准化处理以便进行比较分析  
 aapl_norm= (aapl-aapl.mean()) /aapl.std()  
 msft_norm= (msft-msft.mean()) /msft.std()  

 # 设定延迟范围(±30天)  
 lags=np.arange(-30, 31)  

 # 计算互相关系数  
 cross_corr= [aapl_norm.corr(msft_norm.shift(lag)) forlaginlags]  

 plt.figure(figsize=(10, 6))  
 plt.plot(lags, cross_corr, marker='o')  
 plt.title('Cross-Correlation between AAPL and MSFT Stock Prices')  
 plt.xlabel('Lag (Days)')  
 plt.ylabel('Correlation')  
 plt.axhline(0, color='black', linestyle='--')  
 plt.grid(ls=':',lw='2')  
 plt.show()

互相关分析结果的解读需要关注以下几个关键点:

  • 正延迟区间:当延迟值为正(例如+10天)时,表示MSFT的价格变动领先于AAPL。如果在此区间观察到较高的相关性,即说明MSFT的价格变动可能对AAPL的未来走势具有预示作用。
  • 负延迟区间:当延迟值为负(例如-10天)时,表示AAPL的价格变动领先于MSFT。在此区间的高相关性表明AAPL的价格变化可能预示MSFT的后续走势。
  • 零延迟点:零延迟处的相关系数反映了两支股票的即时关联程度。

举例来说,如果在+5天延迟处观察到显著的正相关性,这表明MSFT的价格变动模式在约5天后往往会在AAPL的价格中得到体现。这种关系可以为量化交易策略的制定提供重要参考。

相干性分析:脑电信号频域关联性研究

相干性分析是一种评估两个信号在频率域上相关程度的方法,用于揭示特定频带内的同步活动。这种分析方法在脑电图研究中具有特殊意义,因为不同脑区在执行认知任务时可能表现出频率同步现象。

对于时间序列信号x(t)y(t),其在频率f处的相干性定义为:

值得注意的是,该公式形式与概率论和统计学中的标准化相关系数有着深刻的数学联系。

下面我们将使用MNE库进行脑电图数据的相干性分析。这个示例将考察两个脑电通道之间的相干性,以识别它们的频率同步特征。

 importmne  
 fromscipy.signalimportcoherence  
 importnumpyasnp  
 importmatplotlib.pyplotasplt  

 # 导入MNE示例脑电数据  
 eeg_data=mne.datasets.sample.data_path()  
 raw=mne.io.read_raw_fif(eeg_data+'/MEG/sample/sample_audvis_raw.fif', preload=True)  

 # 选择脑电通道  
 raw.pick_types(meg=False, eeg=True)  
 eeg_data=raw.get_data()  

 # 提取待分析的两个通道数据  
 eeg_channel_1=eeg_data[0, :]  
 eeg_channel_2=eeg_data[1, :]  

 # 获取采样频率  
 fs=int(raw.info['sfreq'])  

 # 计算通道间相干性  
 f, Cxy=coherence(eeg_channel_1, eeg_channel_2, fs=fs, nperseg=1024)  

 plt.figure(figsize=(20, 11))  
 plt.semilogy(f, Cxy)  
 plt.title('Coherence between EEG Channel 1 and 2')  
 plt.xlabel('Frequency [Hz]')  
 plt.ylabel('Coherence')  
 plt.grid(lw=2,ls=':')  
 plt.show()

相干性谱图中,横轴表示频率(Hz),纵轴表示相干性系数(取值范围0-1):

  • 高相干性区域:在特定频率点(如10 Hz)出现的高相干性表明两个通道在该频率上存在显著的同步活动,这可能对应于特定认知任务期间的α波同步现象。
  • 低相干性区域:相干性较低的频带表明这些频率上两个通道的活动缺乏显著的同步性。

这种分析方法可以有效地揭示大脑不同区域在视觉处理听觉任务或静息状态下的功能连接模式。

在临床应用中,α频带(8-12 Hz)的高相干性通常与视觉注意力任务相关。这种相干性特征可以作为特定认知状态的客观指标,还可以用于神经系统疾病的诊断,例如在癫痫患者中常可观察到异常的神经元同步化现象。

总结

本文详细介绍了时间序列分析中的两种重要工具:互相关相干性分析,并阐述了它们在信号关系研究中的应用:

  • 互相关分析能够有效识别时间序列之间的前导-滞后关系,这在金融市场分析中具有重要应用价值。
  • 相干性分析则专注于揭示信号的频率域特征,在神经科学研究中发挥着关键作用。

通过实际数据分析和Python实现示例,读者可以将这些方法应用于自己的研究领域,从时间序列数据中挖掘有价值的信息。

https://avoid.overfit.cn/post/3800d6eb1c884ea6a22de4a31c68cf85

作者:Thomas Konstantinovsky

目录
相关文章
|
2天前
|
调度 云计算 芯片
云超算技术跃进,阿里云牵头制定我国首个云超算国家标准
近日,由阿里云联合中国电子技术标准化研究院主导制定的首个云超算国家标准已完成报批,不久后将正式批准发布。标准规定了云超算服务涉及的云计算基础资源、资源管理、运行和调度等方面的技术要求,为云超算服务产品的设计、实现、应用和选型提供指导,为云超算在HPC应用和用户的大范围采用奠定了基础。
|
9天前
|
存储 运维 安全
云上金融量化策略回测方案与最佳实践
2024年11月29日,阿里云在上海举办金融量化策略回测Workshop,汇聚多位行业专家,围绕量化投资的最佳实践、数据隐私安全、量化策略回测方案等议题进行深入探讨。活动特别设计了动手实践环节,帮助参会者亲身体验阿里云产品功能,涵盖EHPC量化回测和Argo Workflows量化回测两大主题,旨在提升量化投研效率与安全性。
云上金融量化策略回测方案与最佳实践
|
11天前
|
人工智能 自然语言处理 前端开发
从0开始打造一款APP:前端+搭建本机服务,定制暖冬卫衣先到先得
通义灵码携手科技博主@玺哥超carry 打造全网第一个完整的、面向普通人的自然语言编程教程。完全使用 AI,再配合简单易懂的方法,只要你会打字,就能真正做出一个完整的应用。
8875 20
|
15天前
|
Cloud Native Apache 流计算
资料合集|Flink Forward Asia 2024 上海站
Apache Flink 年度技术盛会聚焦“回顾过去,展望未来”,涵盖流式湖仓、流批一体、Data+AI 等八大核心议题,近百家厂商参与,深入探讨前沿技术发展。小松鼠为大家整理了 FFA 2024 演讲 PPT ,可在线阅读和下载。
4769 12
资料合集|Flink Forward Asia 2024 上海站
|
15天前
|
自然语言处理 数据可视化 API
Qwen系列模型+GraphRAG/LightRAG/Kotaemon从0开始构建中医方剂大模型知识图谱问答
本文详细记录了作者在短时间内尝试构建中医药知识图谱的过程,涵盖了GraphRAG、LightRAG和Kotaemon三种图RAG架构的对比与应用。通过实际操作,作者不仅展示了如何利用这些工具构建知识图谱,还指出了每种工具的优势和局限性。尽管初步构建的知识图谱在数据处理、实体识别和关系抽取等方面存在不足,但为后续的优化和改进提供了宝贵的经验和方向。此外,文章强调了知识图谱构建不仅仅是技术问题,还需要深入整合领域知识和满足用户需求,体现了跨学科合作的重要性。
|
23天前
|
人工智能 自动驾驶 大数据
预告 | 阿里云邀您参加2024中国生成式AI大会上海站,马上报名
大会以“智能跃进 创造无限”为主题,设置主会场峰会、分会场研讨会及展览区,聚焦大模型、AI Infra等热点议题。阿里云智算集群产品解决方案负责人丛培岩将出席并发表《高性能智算集群设计思考与实践》主题演讲。观众报名现已开放。
|
11天前
|
人工智能 容器
三句话开发一个刮刮乐小游戏!暖ta一整个冬天!
本文介绍了如何利用千问开发一款情侣刮刮乐小游戏,通过三步简单指令实现从单个功能到整体框架,再到多端优化的过程,旨在为生活增添乐趣,促进情感交流。在线体验地址已提供,鼓励读者动手尝试,探索编程与AI结合的无限可能。
三句话开发一个刮刮乐小游戏!暖ta一整个冬天!
|
10天前
|
消息中间件 人工智能 运维
12月更文特别场——寻找用云高手,分享云&AI实践
我们寻找你,用云高手,欢迎分享你的真知灼见!
877 58