《中国人工智能学会通讯》——4.6 研究现状及关键技术

简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第4章,第4.6节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。

4.6 研究现状及关键技术

在大部分基于路网的空间关键词查询研究中,路网以有向图的形式表示,即 G=(V,E),其中 V 表示路网中的交叉结点或者根据计算需要人为引入的结点;E 表示连接结点与结点之间的有向边。城市空间文本数据则由大量带有位置属性和文本属性的空间文本对象(Spatio-Textual Objects)组成。空间文本对象可以是物理世界中的实体对象,如商店和公共设施;也可以是各类和实体对象相关联的虚拟对象,如针对实体对象的广告和网络评论。每个空间文本对象表示为 o=(loc, t), 其中 loc 是对象的空间位置 ( 即经纬度 )、t 是对象的文本描述。基于路网的空间关键词查询则结合路网和大量的空间文本对象提供各类查询服务。

基于路网的空间关键词查询的具体查询种类很多,大致可以分为两大类,即通用查询和复杂查询。通用查询主要包括布尔范围查询、布尔 kNN 查询和top-k 查询。具体地,布尔范围查询查找给定范围内包含查询关键词的所有空间文本对象;布尔 kNN 查询查找包含查询关键词并且网络距离最近的 k 个空间文本对象;top-k 查询查找网络距离和文本相似性综合最优的 k 个空间文本对象,其中文本相似性采用信息检索模型计算,如 TF-IDF 模型。

复杂查询主要包括倒转查询[12,18] 、连续查询[14-15]和组合查询[14,19] 。其中,倒转查询查找那些范围查询或者 top-k 查询中包含给定查询对象的对象;连续查询中查询位置不断变化,需要实时更新位置变化后的查询结果;组合查询则要求查询结果包含多类查询对象,同时优化这些对象之间的距离。此外,结合传统的路径查询和关键词查询,可以定义大量路网特有的查询,如基于关键词的最优路径查询[2] 。

实现快速有效的基于路网的空间关键词查询处理需要解决一系列的挑战,主要包括:

● 城市空间文本数据的规模大:城市空间文本数据的规模很大,因为它包含各类带有空间位置信息的数据。如何将这些数据组织存储起来,建立有效的索引结构,并利用索引结构实现快速的查询处理是所有大数据查询面对的主要挑战之一。

● 数据异构性:在基于路网的空间关键词查询中,涉及文本数据、空间数据和图数据等数据类型。这些类型的数据的处理方式存在很大的差别,很难用一个通用的模型来消除这种差异性。

● 大量的网络距离计算:由于查询基于路网结构,所以需要大量的路径计算。与计算两点之间的欧式距离相比,计算两点之间的网络距离的复杂度要高很多。这就增加了实时处理基于路网的空间关键词查询的难度。

● 存在大量 NP 难的查询问题:在已有的基于路网的空间关键词查询中,有很大一部分查询问题是 NP 难的。这就意味着在现有的算法复杂性体系下无法设计具有多项式时间复杂度的查询算法。如何在保证查询质量的前提下有效处理这类查询 , 是基于路网的空间关键词查询研究中的一个难点。

为了减少这些挑战,现有研究工作采用的主要技术包括:

(1) 先进的索引技术为了减少大规模数据带来的时间和空间开销,索引技术是最主要的手段。在基于路网的空间关键词查询中,需要用到图索引技术、文本索引技术、空间索引技术以及空间文本混合索引技术。将这些索引技术融合起来,为查询提供统一的索引机制是解决基于路网的空间关键词查询问题的核心思想。

(2) 快速查询处理技术设计高效的查询处理算法是基于路网的空间关键词查询最主要的任务。一方面,在查询处理过程中,利用构建的索引结构加快查询的处理速度,同时优化查询的处理流程可以在很大程度上降低数据搜索的范围,进而减少计算量。另一方面,利用先进的网络距离计算技术(如 CH [21] 和SILC [22] )可以加速最短路径计算,从而降低整体的查询处理时间。

(3) 剪枝技术在复杂的查询处理中,剪枝技术始终扮演者重要的角色,因为它可以显著加快查询处理的进度。好的剪枝技术需要在查询处理的过程中生成好的上下界,即与真实值比较接近。在基于路网的空间关键词查询中,通过利用路网中距离之间的三角不等关系、欧式距离和网络距离之间的关系,同时结合具体的查询目标,可以生成较优的上下界,从而有效去掉大量的非最优解,达到优化查询速度的目的。

相关文章
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能与机器学习:探索未来的技术边界
【10月更文挑战第18天】 在这篇文章中,我们将深入探讨人工智能(AI)和机器学习(ML)的基础知识、应用领域以及未来趋势。通过对比分析,我们将揭示这些技术如何改变我们的生活和工作方式,并预测它们在未来可能带来的影响。文章旨在为读者提供一个全面而深入的理解,帮助他们更好地把握这一领域的发展趋势。
|
1月前
|
机器学习/深度学习 人工智能 人机交互
图形学领域的研究热点会给人工智能带来哪些挑战和机遇?
图形学中的一些研究热点,如 3D 模型生成与重建,需要大量的 3D 数据来训练模型,但 3D 数据的获取往往比 2D 图像数据更困难、成本更高。而且,3D 数据的多样性和复杂性也使得数据的标注和预处理工作更加繁琐,这对人工智能的数据处理能力提出了更高要求。例如,在训练一个能够生成高精度 3D 人体模型的人工智能模型时,需要大量不同姿态、不同体型的 3D 人体扫描数据,而这些数据的采集和整理是一项艰巨的任务.
103 50
|
18天前
|
机器学习/深度学习 人工智能 自然语言处理
深入理解人工智能中的深度学习技术及其最新进展
深入理解人工智能中的深度学习技术及其最新进展
|
18天前
|
机器学习/深度学习 人工智能 自然语言处理
深入理解人工智能中的深度学习技术及其最新进展
深入理解人工智能中的深度学习技术及其最新进展
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能与深度学习:探索未来技术的无限可能
在21世纪,人工智能(AI)和深度学习已经成为推动科技进步的重要力量。本文将深入探讨这两种技术的基本概念、发展历程以及它们如何共同塑造未来的科技景观。我们将分析人工智能的最新趋势,包括自然语言处理、计算机视觉和强化学习,并讨论这些技术在现实世界中的应用。此外,我们还将探讨深度学习的工作原理,包括神经网络、卷积神经网络(CNN)和循环神经网络(RNN),并分析这些模型如何帮助解决复杂的问题。通过本文,读者将对人工智能和深度学习有更深入的了解,并能够预见这些技术将如何继续影响我们的世界。
58 7
|
1月前
|
人工智能 自然语言处理 自动驾驶
技术与人性:探索人工智能伦理的边界####
本文深入探讨了人工智能技术飞速发展背景下,伴随而来的伦理挑战与社会责任。不同于传统摘要直接概述内容,本文摘要旨在引发读者对AI伦理问题的关注,通过提出而非解答的方式,激发对文章主题的兴趣。在智能机器逐渐融入人类生活的每一个角落时,我们如何确保技术的善意使用,保护个人隐私,避免偏见与歧视,成为亟待解决的关键议题。 ####
|
1月前
|
机器学习/深度学习 人工智能 机器人
推荐一些关于将图形学先验知识融入人工智能模型的研究论文
推荐一些关于将图形学先验知识融入人工智能模型的研究论文
|
1月前
|
机器学习/深度学习 人工智能 数据可视化
人工智能在图形学领域的研究热点有哪些?
AIGC:通过生成对抗网络(GAN)、变分自编码器(VAE)及其变体等技术,能够根据用户输入的文字描述、草图等生成高质量、高分辨率的图像,在艺术创作、游戏开发、广告设计等领域应用广泛。如OpenAI的DALL-E、Stable Diffusion等模型,可生成风格各异、内容丰富的图像,为创作者提供灵感和素材.
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
深度探索人工智能中的自然语言处理技术#### 一、
【10月更文挑战第28天】 本文旨在深入剖析人工智能领域中的自然语言处理(NLP)技术,探讨其发展历程、核心算法、应用现状及未来趋势。通过详尽的技术解读与实例分析,揭示NLP在智能交互、信息检索、内容理解等方面的变革性作用,为读者提供一幅NLP技术的全景图。 #### 二、
86 1
|
18天前
|
机器学习/深度学习 人工智能 自然语言处理
深入探讨人工智能中的深度学习技术##
在本文中,我们将深入探讨深度学习技术的原理、应用以及未来的发展趋势。通过分析神经网络的基本结构和工作原理,揭示深度学习如何在图像识别、自然语言处理等领域取得突破性进展。同时,我们还将讨论当前面临的挑战和未来的研究方向,为读者提供全面的技术洞察。 ##