开发者社区> 技术小美> 正文

地图检索 – 与众不同

简介:
+关注继续查看

前言:

半年前,和师弟在一起吃饭时,他忽然抬头,很好奇地问我:“为什么有了百度的大检索,百度地图还要自己做检索呢?”这个问题也一直伴随着我,后来有幸转入检索方向,不断摸索,也才有了这篇文章。

正文:

地图检索,顾名思义,是在地图里的检索。它与大检索大同小异,虽然在切词粒度、专名识别、拉链归并和rank等很多细节上与大检索有一定差异,然而真正让他与众不同、独具风采的,是地图领域所特有的空间位置信息。

在地图检索领域中,每条query都富含空间信息,每条数据也都有自己的空间位置。如何解析、利用这些空间信息,就成为了地图检索的特色主线。本文也就这个主题进行介绍,在章节安排上,参考一个普通query的检索过程,分为三大部分:query解析、查询与归并、rank。

 

1. query解析中的位置信息

传统检索的query解析,主要功能是对query进行类型识别、分词、同义等处理,以便后续查询与rank。地图检索里的query解析,不仅包含了传统解析的功能,而且要从用户的query里去挖掘空间位置信息。

为什么要这么做呢?举几个简单的例子:

例1:北京和上海都存在数据点“第一上海中心”,那么身在北京的用户A和身在上海的用户B,同时检索“第一上海中心”,结果是否需要有所不同呢?

例2:用户在地图中输入query“中关村肯德基”,我们没有叫“中关村肯德基”的数据点,但却有许多位置在中关村附近的肯德基点,那么我们如何召回呢?

这两个例子形象地描述了用户发起检索所包含的两种空间位置信息,以及我们为什么要去挖掘这些空间信息。

首先,例1对应的是一次检索中所隐含的位置倾向信息。用户所在的城市(可用ip地址近似模拟或者无线设备定位)、用户输入query时的上下文场景(主要是底图所在城市)是两种比较直观的位置倾向信息;我们需要利用这两种数据来大致判定结果的位置倾向,以便提供更优秀的检索结果。相对来讲,这是一种粗粒度的位置信息。

其次,例2对应的是query的子term中所明确包含的位置信息。地图query的特点在于,某些term是表示检索范围的(空间位置),某些term是表示文本实体的;“中关村肯德基”中,“中关村”表示检索范围,“肯德基”表示实体,这个query可以理解为用户想检索“在中关村附近的肯德基”,也就是在“中关村”附近检索“肯德基”。相对来讲,这是一种细粒度的位置信息。

总而言之,地图的query解析需要去挖掘query中的隐含或明确的位置信息,从而真正理解用户的需求。

2. 查询与归并中的位置信息

经过query解析之后,query中的term被分为两种,一种表示空间,一种表示文本,如何利用这些term的属性,来召回最合适的数据,就成为另外一个问题。

让我们来看看地图检索的查询归并与传统检索的不同:

 

图1. 普通检索与地图检索的查询归并对比

如图1所示,普通检索的查询归并结果,是“中关村”和“肯德基”文本查询集合的交集;而地图检索的查询归并结果,除了两者的文本交集之外,还包括“肯德基”的文本查询集合与“中关村”的空间范围的交集,而往往后者召回的比前者要多。

也就是说,我们不仅要召回传统文本上的归并结果,也要从空间维度上去做归并,从而得到更多、更准确的召回。

3. rank中的位置信息

与传统检索展示文本列表不同,地图结果以图区加icon的形式,将结果非常形象地展现在底图上,而这也给地图检索的rank提出了新的需求:我们不能停留在文本相关度这一单一维度上,而是要给用户呈现准确而舒适的结果。

那么这个舒适体现在什么地方呢?这里也举两个例子给大家看一下:

 

 

图2.a                     图2.b                     图2.c                                                                       

北京市下检索“清华大学”,如果在海淀区和朝阳区都有清华大学相关的数据,那么可以有三种结果展现形式,如图2.a – 2.c所示。图2.a是普通的未经空间调权的rank结果,图区拉得很大,右下角的结果对90%以上的用户都是噪声,显示效果不够友好;图2.b则是经过空间调权后的rank结果,视野集中在“清华大学”主点附近,效果要优于图2.a,但是这同样给出了一大堆相关结果列表,也会干扰用户;图2.c则是经过空间内聚形成的结果,精确命中“清华大学”主点,图区大小合适,显示效果最好。

这个例子展示了如何利用结果的位置信息来提升体验,下面再给大家介绍一下用户的位置信息的利用:

 

 

图3.a    

 

  图3.b

当用户检索生活类泛需求词时,那么用户所在位置信息就显得至关重要。如图3所示,用户如果在百度大厦用移动设备检索“餐馆”,图3.a是未经空间距离调权的结果,显得比较杂乱;图3.b则是以用户所在地为中心点,进行距离调权后的结果,则显得更紧凑,优先级更直观。

由此可见,地图检索的rank仅仅考虑文本相关性是不够的,还需要考虑空间位置信息,包括query和检索结果的位置信息,也包括用户的位置信息。只有充分运用好这些位置信息,才能给用户更准确、更舒适的结果。

介绍到这里,相信大家已经对地图检索里的空间信息有了直观的认识。事物总有正反两面,空间位置信息的引入虽然使得地图检索充满魅力,但也成为了地图检索的重点与难点。如何有效地利用这些信息,使其与传统的文本相关性、实体重要性等因素相互作用、形成合力,是一个需要我们不断去征服的高峰。

by  liyang

 

 











本文转自百度技术51CTO博客,原文链接:http://blog.51cto.com/baidutech/743017,如需转载请自行联系原作者


版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
【从零开始学GIS再到精通GIS】专题图制作-地图渲染-地图整饰
【从零开始学GIS再到精通GIS】专题图制作-地图渲染-地图整饰
68 0
立体呈现案例
立体呈现案例
13 0
百度地图开发-在地图上检索数据 08
百度地图开发-在地图上检索数据 08
164 0
网页如何利用栅格化做自适应布局
建立你的网格系统和布局 网格系统真的很重要。 这些技巧都是为了让你做事更简单,并减少你设计时做决定的次数。
173 0
【前端搞地图】如何设计一张让用户过目不忘的地图-2
【前端搞地图】如何设计一张让用户过目不忘的地图-2
116 0
【前端搞地图】如何设计一张让用户过目不忘的地图
【前端搞地图】如何设计一张让用户过目不忘的地图
312 0
网站地图有什么好处?sitemap地图怎么生成?
网站地图,又称站点地图,可以理解为包含网站中所有页面链接的容器,主要帮助搜索引擎快速抓取网站中的所有页面。很多新人可能对地图了解不够。今天网站地图目录网详细讲讲制作网站地图的好处,以及如何制作Sitemap地图。
343 0
+关注
技术小美
文章
问答
视频
文章排行榜
最热
最新
相关电子书
更多
数据展现:可视化报表及嵌入应用
立即下载
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载