1、研究背景
近些年来,我国旅游业发展态势十分良好,出行人数不断增多,这样的盛况直接促使交通行业有所发展,地铁的客流量也随之提升,参照图1. 1可以看出 2019 - 2024 年我国旅游行业总收入的情况,2019 年时,旅游行业总收入达到 6.63 万亿元,那时旅游业十分兴盛,但是到了 2020 年,一场突然爆发的新冠疫情打乱了这种状况,旅游业立刻陷入低谷,出游人数明显缩减,旅游收入也大幅下滑,该年总收入仅有 2.23 万亿元。2021年,疫情防控形势有所改善之后,旅游市场渐渐开始回暖,但是部分地区偶尔还是会遭受局部疫情的冲击,因而整个旅游业的恢复速度比较缓慢。2022年疫情结束以后,旅游业的复苏节奏变快,到了2024年,国内旅游出游人数达到56.12亿,旅游收入为5.75万亿元,大致达到了2019年疫情前水平的九成,这充分表明旅游市场具备很强的复苏活力[1]。
2、研究意义
随着旅游市场变得日益火爆,人们的出行习惯也随之发生了改变,如今人们外出时更加注重便捷与舒适,对地铁这类公共交通的依赖程度日益提高,当游客在城市间往来穿梭时,大多时候将地铁作为主要的交通工具,这使得旅游旺季时地铁的客流量呈现出周期性波动——每逢节假日,地铁内便人潮涌动,一波接着一波。面对这种情况,地铁营运部门要是想满足游客和行人的出行需求,便需要知道大概什么时间段或特殊节假日的人流量趋势,只要提前掌握了人流量的状况便可以先发制人,在高峰期时刻增加车次,做好充足的资源分配,就像在高铁站的地铁口通常会多设置几个安检口,为了让乘客快速过安检,避免后面形成拥堵局面。人们乘坐地铁也会更加舒适高效,不用长时间等候,也不用担心坐不了地铁。
3、研究现状
近年来国内人流量预测系统的研究取得了大幅度进展,特别是在技术融合与应用创新这方面。基于手机信令数据的预测方法成为研究热点,北京市交通委员会在2019年国庆节期间使用该技术推出“城市大脑”应用,通过实时分析用户位置信息实现人流量动态监测,该预测精度在重点商圈达到85%以上。该系统通过5G基站每15分钟采集一次数据,结合历史客流规律建立LSTM神经网络模型,成功将节假日期间王府井步行街的人流拥堵预警响应时间缩短至30分钟内[4]。
在轨道交通领域,深圳地铁集团联合高校研发的时空图卷积网络(STGCN)模型,将客流预测误差率从传统方法的18%降至9.2%。该模型整合了AFC刷卡数据、Wi-Fi探针数据及POI兴趣点数据,通过图神经网络捕捉站点间拓扑关系,在早晚高峰时段(7:30-9:00/17:30-19:00)的预测准确率较ARIMA模型提升41%。2024年杭州亚运会期间,该系统在奥体中心站实现单日120万人次客流的精准预测,保障了赛事期间地铁运营安全[5]。
商业场景应用方面,上海南京路步行街部署的多源数据融合平台,整合了2300个智能摄像头、150个蓝牙信标及美团点评的消费数据,构建了“时空注意力机制+Transformer”的混合预测模型。2024年国庆假期数据显示,该系统提前4小时预测客流峰值的准确率达92%,帮助商家动态调整促销策略,使重点商户销售额同比增长27%。技术层面,模型通过引入外部气象数据(温度、降水)和社交媒体热度指数,使突发客流的预测响应速度提升至10分钟级[6]。
但是研究仍面临数据隐私保护与模型可解释性挑战。2024年中国信通院报告指出,63%的商用预测系统存在个人信息过度采集风险,而且深度学习模型的“黑箱”特性导致38%的交通管理部门对预测结果持保留态度。未来研究将重点突破联邦学习框架下的分布式预测技术,以及基于SHAP值的模型可解释性增强方案[7]。
4、研究技术
4.1 人工神经网络
卷积神经网络(CNN)适用于有网格结构的数据,在人流量预测这项工作当中,它可依据卷积层去提取局部特征,借助池化层来降低维度并且提高鲁棒性,然后依靠全连接层整合特征输出预测结果,循环神经网络(RNN)以及改进版的长短期记忆网络(LSTM),它们适用于序列数据的预测。LSTM 引入了门控机制,其中包含输入门、遗忘门和输出门,可有效地筛选并保留有价值的历史信息,比较适合捕捉人流量数据当中的长期依赖关系[14]。
4.1.1 卷积神经网络(CNN)
卷积神经网络是一种带有卷积运算特点的前馈神经网络架构,在计算机视觉以及语音处理等应用场景里呈现出出色的性能表现,其核心优势在于达成了高效的特征自动提取机制,该网络模型支持监督式学习范式,也支持非监督式学习范式,在维持稳定预测性能的还降低了传统机器学习方法对特征工程处理的依赖程度。CNN包含以下几种层结构:
1、卷积层通过卷积核的数学运算实现数据局部特征的提取,其输入数据可表示为三维张量,其中C代表通道数,H和W分别表示数据的高度和宽度。滤波器参数可表征为四维张量,其中FN表示滤波器数量,FH和FW分别定义滤波器的高度和宽度维度。经过FN个滤波器的卷积操作后,系统将生成对应数量的特征图,这些特征图经堆叠后形成维度为的输出特征块,其中OH和OW为输出特征图的空间尺寸。该特征块将作为下一层神经网络的输入数据,构成卷积神经网络的标准前向传播流程。值得注意的是,卷积运算过程中还需引入偏置项以增强模型的表达能力[15]。
2、池化层:池化层可以将卷基层处理后的数据,即局部特征进一步实现下采样处理。池化主要有两种方法,平均值池化和最大值池化。平均值池化计算出池化窗口中的所有数的平均值进行输出,最大值池化通过选择窗口中所有数中的最大值进行输出。池化层没有要学习的参数,也不会使通道数发生变化,并且对输入数据微小的位置变化具有鲁棒性。
3、全连接层:将所有的局部特征整合为全局特征,将学到的“分布式特征表示”映射到样本标记空间。
4.1.2 循环神经网络(RNN)及长短期记忆网络(LSTM)原理
循环神经网络是一种专门用来处理序列数据的神经网络架构,它的核心特点是拥有带有记忆功能的循环拓扑结构,这样独特的设计能让它有效地对序列数据里的时序依赖关系进行建模,该模型本质上是序列到序列的映射框架,其网络结构可抽象成含有循环单元的有向图表示,在这个有向图里每个节点都对应着一个有状态保持能力的计算单元。
5、系统实现