KDD 2024:零样本即可时空预测!港大、华南理工等发布时空大模型UrbanGPT

简介: 【8月更文挑战第21天】UrbanGPT是由香港大学等机构研发的时空大模型,针对城市管理中因数据稀缺导致的预测难题,通过时空依赖编码器与指令调整技术实现强大的泛化能力。此模型能在多种城市任务中无需样本进行准确预测,如交通流量和人群流动等,有效应对数据收集难的问题,在零样本场景下表现优异,为智慧城市管理提供了有力工具。[论文](https://arxiv.org/abs/2403.00813)

近年来,随着城市化进程的加快,城市环境的动态变化日益复杂,对城市管理提出了新的挑战。为了更好地理解和预测城市环境的变化,研究人员提出了一种名为UrbanGPT的时空大模型。

UrbanGPT是由香港大学、华南理工大学等机构的研究人员共同开发的,旨在解决城市环境中的时空预测问题。该模型结合了大型语言模型(LLMs)的成功经验,通过整合时空依赖编码器和指令调整范式,实现了在各种下游城市任务中的出色泛化能力。

时空预测是指对城市环境在时间和空间上的动态变化进行预测和洞察。其目的是预测未来的趋势、模式和事件,包括交通流量、人口流动和犯罪率等多个方面。然而,时空预测面临着许多挑战,其中之一就是数据稀缺问题。

在实际的城市传感场景中,数据稀缺是一个普遍存在的问题。许多现有的时空预测方法严重依赖于大量的标记数据来生成准确的时空表示。然而,由于数据收集和标记的成本较高,许多城市环境中的数据集都存在数据稀缺的问题。

为了解决数据稀缺问题,研究人员提出了UrbanGPT模型。该模型通过将时空依赖编码器与指令调整范式相结合,实现了在各种时空学习场景中的强大泛化能力。

具体而言,UrbanGPT模型包括两个主要组成部分:时空依赖编码器和指令调整范式。时空依赖编码器用于理解时间和空间上的复杂依赖关系,而指令调整范式则用于指导模型在各种下游任务中的学习过程。

通过这种设计,UrbanGPT模型能够更好地理解城市环境中的时空依赖关系,从而在数据稀缺的情况下做出更准确的预测。

为了验证UrbanGPT模型的有效性,研究人员在各种公开数据集上进行了广泛的实验,涵盖了不同的时空预测任务。实验结果表明,UrbanGPT模型在各种任务上都取得了出色的性能,并显著优于现有的基线方法。

这些实验结果证明了UrbanGPT模型在时空预测任务中的潜力,特别是在零样本场景下,即在没有标记数据的情况下进行预测。

然而,尽管UrbanGPT模型在时空预测任务中取得了显著的成果,但仍然存在一些挑战和限制。首先,由于城市环境的复杂性和多样性,时空预测任务本身就具有很高的难度。其次,尽管UrbanGPT模型在数据稀缺的情况下表现出色,但在数据充足的情况下,其性能是否能够与现有的深度学习方法相媲美仍需进一步验证。

论文链接:https://arxiv.org/abs/2403.00813

目录
相关文章
|
机器学习/深度学习 人工智能 达摩院
[ICML'22] 阿里巴巴达摩院FEDformer,长程时序预测全面超越SOTA
本文介绍阿里巴巴达摩院决策智能实验室时间序列预测方向的最新(ICML 2022 accepted)工作:FEDformer: Frequency Enhanced Decomposed Transformer for Long-term Series Forecasting论文链接:https://arxiv.org/abs/2201.12740代码链接:https://github.com/DA
2577 0
[ICML'22] 阿里巴巴达摩院FEDformer,长程时序预测全面超越SOTA
|
3月前
|
机器学习/深度学习
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
【8月更文挑战第16天】近日,清华大学等机构发布了MultiTrust多模态评估研究,旨在全面评估大型语言模型的可信度。这是首个统一的多模态基准,覆盖真实性、安全性等五大方面,包含32个任务。研究对21个现代模型进行了实验,揭示了可信度问题和风险,强调了提高模型可靠性的重要性。结果显示开源模型在可信度上落后于专有模型,特别是在安全性方面。此外,研究还发现了模型在鲁棒性、公平性和隐私方面的挑战。论文已发布于arxiv.org。
58 1
|
3月前
|
机器学习/深度学习 数据采集 数据挖掘
【第十届“泰迪杯”数据挖掘挑战赛】B题:电力系统负荷预测分析 ARIMA、AutoARIMA、LSTM、Prophet、多元Prophet 实现
详细介绍了在第十届“泰迪杯”数据挖掘挑战赛B题中对电力系统负荷进行预测分析的方法,包括数据预处理、特征工程、平稳性检验、数据转换以及使用ARIMA、AutoARIMA、LSTM、Prophet和多元Prophet模型进行建模和预测,并提供了完整代码的下载链接。
100 0
|
6月前
|
运维
ICLR 2024:跨领域准确进行零样本异常检测,浙大等提出AnomalyCLIP
【5月更文挑战第12天】 浙大、新大和哈佛研究人员合作提出AnomalyCLIP,利用预训练的视觉-语言模型CLIP,学习对象无关文本提示,实现准确的跨领域异常检测。在17个数据集上表现出色,但存在特定领域适应性和计算复杂度问题。研究表明潜力,尤其对工业和医学图像分析。[论文链接](https://arxiv.org/pdf/2310.18961.pdf)
167 1
|
人工智能 算法 图形学
山大SIGGRAPH 2023 最佳论文得主分享:点云法向估计及保特征重建
山大SIGGRAPH 2023 最佳论文得主分享:点云法向估计及保特征重建
231 0
|
6月前
|
机器学习/深度学习 人工智能 Java
【AI for Science】量子化学:分子属性预测-第2次打卡-特征工程baseline上分
【AI for Science】量子化学:分子属性预测-第2次打卡-特征工程baseline上分
|
6月前
|
机器学习/深度学习 传感器 算法
【论文速递】ICCCS2022 - FedMMD:基于多教师和多特征蒸馏的异构联邦学习
【论文速递】ICCCS2022 - FedMMD:基于多教师和多特征蒸馏的异构联邦学习
|
人工智能 算法
阿里云人工智能平台 PAI 扩散模型加速采样算法论文入选 CIKM 2023
近日CIKM 2023上,阿里云人工智能平台PAI和华东师范大学陈岑副教授团队主导的扩散模型加速采样算法论文《Optimal Linear Subspace Search: Learning to Construct Fast and High-Quality Schedulers for Diffusion Models》入选。此次入选意味着阿里云人工智能平台 PAI自研的扩散模型算法和框架达到了全球业界先进水平,获得了国际学者的认可,展现了中国人工智能技术创新在国际上的竞争力。
|
机器学习/深度学习 数据采集 人工智能
金融时间序列预测方法合集:CNN、LSTM、随机森林、ARMA预测股票价格(适用于时序问题)、相似度计算、各类评判指标绘图(数学建模科研适用)
金融时间序列预测方法合集:CNN、LSTM、随机森林、ARMA预测股票价格(适用于时序问题)、相似度计算、各类评判指标绘图(数学建模科研适用)
金融时间序列预测方法合集:CNN、LSTM、随机森林、ARMA预测股票价格(适用于时序问题)、相似度计算、各类评判指标绘图(数学建模科研适用)
|
机器学习/深度学习 自然语言处理 算法
KDD 2023 | 第四范式开发用于分子性质预测的生成式3D预训练模型
KDD 2023 | 第四范式开发用于分子性质预测的生成式3D预训练模型
125 0