Redis 3.2版本一个重大的更新是新增了GEO地理位置相关的命令。
目前Redis对地理位置支持提供了一下6个命令:
1. geoadd:增加地理位置的坐标。
2. geodist:获取两个地理位置的距离。
3. geohash:获取地理位置的GeoHash值。
4. geopos:获取地理位置的坐标。
5. georadius:根据给定经纬度坐标获取指定范围内的地理位置集合。
6. georadiusbymember:根据给定地理位置获取指定范围内的地理位置集合。
GeoHash基本原理
GeoHash是一种地址编码,通过切分地图区域为小方块(切分次数越多,精度越高),它能把二维的经纬度编码成一维的字符串。
也就是说,理论上geohash字符串表示的并不是一个点,而是一个矩形区域,只要矩形区域足够小,达到所需精度即可。
编码过程
以经纬度(116.3906,39.92324)为例:
1.对于维度39.92324,39.92324属于(0,90),所以取编码为1。
然后再将(0,90)分成(0,45),(45,90)两个区间,而39.92324位于(0,45),所以编码为0。
以此类推,直到精度符合要求为止,得到纬度编码为10111000110001111001。
2.经度也用同样的算法,对(-180,180)依次细分,得到116.3906的编码为11010010110001000100。
3.接下来将经度和纬度的编码合并,奇数位是纬度,偶数位是经度,得到编码1110011101001000111100000011010101100001。
4.最后,用0-9、b-z(去掉a, i, l, o)这32个字母进行base32编码,得到(39.92324,116.3906)的编码为wx4g0ec1。
(116.3906,39.92324)对应的地图位置就是http://geohash.org/wx4g0ec1,
降低一些精度,就会是
http://geohash.org/wx4g0ec,
再降低一些精度,就会是http://geohash.org/wx4g0。
编码特性
不难看出这样的编码方式仅用一个字符串保存经纬度信息,并且精度由字符串从头到尾的长度决定,编码长度越长,精度越高。
GeoHash值的前缀相同的位数越多,代表的位置越接近,可以方便索引。(反之不成立,位置接近的GeoHash值不一定相似).
但这种方案的缺点是:从geohash的编码算法中可以看出,靠近每个方块边界两侧的点虽然十分接近,但所属的编码会完全不同。
实际应用中,需要通过去搜索环绕当前方块周围的8个方块来解决该问题。
除此之外,这个方案也无法直接得到距离,需要程序协助进行后续的排序计算。
Redis Geo命令实现
Redis将地理位置的52位GeoHash值作为有序集合的score,将地理位置存放在有序集合中进行保存。
后续按位置搜索时,依据GeoHash的特性搜索当前方块与环绕当前方块的8个方块来搜索目标位置集合。
1.GEOADD
命令:GEOADD key longitude latitude member [longitude latitude member ...]
命令描述:将指定的地理空间位置(纬度、经度、名称)添加到指定的key中。
返回值:添加到sorted set元素的数目,但不包括已更新score的元素。
Redis中接受的有效的精度范围为-180到180度,有效维度范围为-85.05112878到85.05112878度(靠近南北极的一小块地方是无法生成索引的)。
- GEOADD 实现方式
Redis内部使用有序集合来保存key,每一个member的score大小为一个52位的Geohash值(double类型精度为52位)。
实际上Redis内部实现的时候就是将GEOADD命令转换成ZADD命令来实现的。
(这也解释了为什么没有专门的georem命令,地理位置信息是通过使用ZREM命令来删除成员。)
2.GEODIST
命令:GEODIST key member1 member2 [unit]
命令描述:
返回两个给定位置之间的距离。如果两个位置之间的其中一个不存在,那么命令返回空值。指定单位的参数 unit 必须是以下单位的其中一个:
- m 表示单位为米。
- km 表示单位为千米。
- mi 表示单位为英里。
- ft 表示单位为英尺。
- GEODIST 实现方式
使用WGS84坐标系统,计算距离时使用Haversine公式。由于地球并不是严格标准的,计算出来的距离有最大约0.5%的误差。
3.GEOPOS
命令:GEOPOS key member [member ...]
命令描述:从key里返回所有给定位置元素的位置(经度和纬度)。
返回值:GEOPOS 命令返回一个数组,数组中的每个项都由两个元素组成:
第一个元素为给定位置元素的经度,而第二个元素则为给定位置元素的纬度。当给定的位置元素不存在时,对应的数组项为空值。
4.GEOHASH
命令:GEOHASH key member [member ...]
命令描述:返回一个或多个位置元素的Geohash表示。通常使用表示位置的元素使用不同的技术,使用Geohash位置52点整数编码。
由于编码和解码过程中所使用的初始最小和最大坐标不同,编码的编码也不同于标准。此命令返回一个标准的Geohash
返回值:一个数组,数组的每个项都是一个 geohash 。命令返回的 geohash 的位置与用户给定的位置元素的位置一一对应。
- GEOHASH 实现方式
Redis在内部生成有序集合成员score时的geohash值与标准的算法略有差异(Redis内部使用-85,85作为维度范围,标准使用-90,90)。
这个命令返回的是标准值,与https://en.wikipedia.org/wiki/Geohash中标准算法和geohash.org网站的结果一致。
5.GEORADIUS
命令:GEORADIUS key longitude latitude radius m|km|ft|mi [WITHCOORD][WITHDIST][WITHHASH][COUNT count]
命令描述:
以给定的经纬度为中心,返回键包含的位置元素当中,与中心的距离不超过给定最大距离的所有位置元素。
范围可以使用以下其中一个单位:
m 表示单位为米。
km 表示单位为千米。
mi 表示单位为英里。
ft 表示单位为英尺。
在给定以下可选项时,命令会返回额外的信息:
WITHDIST:在返回位置元素的同时,将位置元素与中心之间的距离也一并返回。距离的单位和用户给定的范围单位保持一致。
WITHCOORD:将位置元素的经度和维度也一并返回。
WITHHASH:以52位有符号整数的形式,返回位置元素经过原始 geohash 编码的有序集合分值。这个选项主要用于底层应用或者调试,实际中的作用并不大。
命令默认返回未排序的位置元素。通过以下两个参数,用户可以指定被返回位置元素的排序方式:
ASC:根据中心的位置,按照从近到远的方式返回位置元素。
DESC:根据中心的位置,按照从远到近的方式返回位置元素。
在默认情况下, GEORADIUS 命令会返回所有匹配的位置元素。虽然用户可以使用 COUNT <count>选项去获取前 N 个匹配元素,但是因为命令在内部可能会需要对所有被匹配的元素进行处理,所以在对一个非常大的区域进行搜索时,即使只使用 COUNT 选项去获取少量元素,命令的执行速度也可能会非常慢。但是从另一方面来说,使用 COUNT 选项去减少需要返回的元素数量,对于减少带宽来说仍然是非常有用的。
返回值:
在没有给定任何 WITH 选项的情况下,命令只会返回一个像[“NewYork”,”Milan”,”Paris”]这样的线性(linear)列表。
在指定了 WITHCOORD 、 WITHDIST 、 WITHHASH 等选项的情况下,命令返回一个二层嵌套数组,内层的每个子数组就表示一个元素。
在返回嵌套数组时,子数组的第一个元素总是位置元素的名字。至于额外的信息,则会作为子数组的后续元素,按照以下顺序被返回:
以浮点数格式返回的中心与位置元素之间的距离,单位与用户指定范围时的单位一致。
geohash 整数。
由两个元素组成的坐标,分别为经度和纬度。
- GEORADIUS实现方式
GeoHash值的前缀相同的位数越多,代表的位置越接近,可以方便索引。但反之不成立,位置接近的GeoHash值不一定相似。
靠近每个方块边界两侧的点虽然十分接近,但所属的编码会完全不同。实际应用中,需要通过去搜索环绕当前方块周围的8个方块来解决该问题。
搜索的时候会检查挡墙方块+8个覆盖整个搜索半径的区域,不断的去除geohash的低位,直到这9个方块能覆盖搜索半径位置。再一次搜索计算每个位置的距离。
6.GEORADIUSBYMEMBER
命令:GEORADIUSBYMEMBER key member radius m|km|ft|mi [WITHCOORD][WITHDIST][WITHHASH][COUNT count]
命令描述:这个命令和 GEORADIUS 命令一样,都可以找出位于指定范围内的元素,但是 GEORADIUSBYMEMBER 的中心点是由给定的位置元素决定的。