百度迁徙用到了哪些技术?

简介:

0

最近一朋友问我百度迁徙图到底是怎么弄出来的?而在这过程中发现我原来也有我好多不明白的地方,这也激发了我这个技术宅的兴趣,我到处找资料研究终于知道了基本的整个原理,后来想想肯定也有很多朋友不知道这背后的原理,那就分享出来做个科普吧。


为什么会有地理定位这个技术?


一谈到为什么会有定位技术,可能很多人的第一反应是认为这个发明就是为了让自己看地图还有找餐馆的,呵呵,其实事实相去甚远。


现在我们从源头来讲,为什么我们会有地理定位技术?


其实最早的定位系统是来自美国国防部50年代的军备竞赛,当时苏联在1957年发射了Sputnik-1人造卫星,而美国不甘示弱,1958年,为了实现军事上的高精确打击,美国海军开始研制子午仪卫星定位系统。1973年美国建立国防导航卫星系统DNSS,此后DNSS改名为Navstar即授时和测距导航卫星或者说是全球定位系统(Navigation Signal Timing and Ranging/Global Positioning System),后来简称GPS。1994年,终于完成覆盖全球98%的卫星系统。


从军备竞赛到全面民用这和互联网的发展有相似之处,互联网的前生就是为了防止遭到苏联的核打击后被摧毁重要中心节点导致全面瘫痪,进而建立起的去中心化网络,这个意外的军事发明也在随后被民间大量普及。


一切都是意外啊亲,这个发明真的不是用来给你找餐馆的。


百度如何做定位的?


百度、苹果谷歌是不是只用GPS定位呢?错了,因为民用GPS的定位误差大,没有军用GPS定位准确,而科技公司不可能发射高精度卫星,只能退而求其次,除了用GPS定位以外还会用其他办法为用户做到更精确的定位,下面开始介绍百度定位时用到的方法。


百度地图定位用到的主流方法:


1)GPS定位,主要用于室外导航。


2)IP定位,这在PC时代一直都在用,比如以前用QQ外挂的时候可以看到对方在那座城市和网吧,就是用的IP定位技术。但是IP定位有个弱点就是范围不是太精确,只能定位到街道级别。


3) 基站定位,用户用2G、3G和4G网络都是要经过运营商基站的,那么通过获得用户所使用的基站位置,判断用户位置,定位半径精确范围是265米左右。


4)WIFI定位,WIFI定位是最为精准的,因为WIFI的强度半径相比于其他来说都最小,当然这里的WIFI指的是大商场或者咖啡厅的wifi,通过这些公用WIFI就能相当精准的收集到信息,定位半径精确范围是35米左右。


5)混合定位,就是将上述定位方法全部混合,定位半径精确范围是60米左右。


基于以上定位方法,使用大数据相关技术才能实现比较精确的定位。例如,一个用户既连着WIFI又连着基站的4G,那么百度就可以根据该WIFI在和基站在数据库中的空间坐标以及他们的辐射半径来计算出更精确的位置范围。百度还会根据用户连接基站时移动中的信号强弱变化确定用户位置,计算起来相当复杂。


上面谈的都是如何更精确定位的技术,现在谈下如何为用户提供决策方案的技术。百度通过收集大量用户在某些地段移动的设备、速度进而来判断某个路段的交通拥堵情况,这就是百度地图的“实时路况”功能,而百度导航又会根据“实时路况”为用户提供出行最优解决方案,当然,目前除了为个人出行提供决策方案以外,已经在为交通部的道路规划提供决策支持。


百度迁徙的数据从哪里来?


好了,现在再谈最后一个问题了,有了这样的技术后,百度迁徙的数据从哪里来


数据来源一:地图用户。凡是使用百度地图的用户,百度就可以收集到对应数据,根据CNNIC发布的《2013-2014年中国移动互联网调查研究报告》,2014年8月百度地图占领地图市场的63.7%的用户,这也就是说百度能够收集到绝对多数的移动互联网用户的出行数据。


数据来源二:第三方应用。很多手机应用都是需要地理定位的,比如天气应用,再比如同城类应用,而普通开发者一般是没有强大定位技术的,只能借助于第三方开放定位技术平台,在国内做的最好的两家也就是百度地图开放平台和高德地图开放平台,而选择百度地图开放平台的应用,只要用户使用该应用,百度就能获得更多的数据。


目前墨迹天气和百信网用的就是百度地图的开放技术,还有更多安装了百度地图的应用百度就能收集数据。


这两个数据源就是百度最主要的数据统计来源,目前百度已与交通部有深入合作,预计后期会有可能来自交通部更加精确的数据。


最后,百度用这些定位数据的变化在春节期间做出了很diao的“百度迁徙”。


结语


百度迁徙图非常有意思,我们看到的是一个最后呈现的完整数据图,但是在这背后确有十分复杂的高精尖技术做支撑,远比我们想象中的复杂。同时我们也看到地理定位技术最先发源于军事,最后又由于移动时代的商业发展诉求得到了更为深入的发展,所以顺着这次百度迁徙我们也再次看到了驱动技术发展的本质—恐惧与欲望。


原文发布时间为:2015-02-19

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
1月前
|
运维 网络协议 安全
长连接网关技术专题(十):百度基于Go的千万级统一长连接服务架构实践
本文将介绍百度基于golang实现的统一长连接服务,从统一长连接功能实现和性能优化等角度,描述了其在设计、开发和维护过程中面临的问题和挑战,并重点介绍了解决相关问题和挑战的方案和实践经验。
79 1
|
5月前
|
搜索推荐 中间件
系统入门到实战学习某项技术、有问题找"百度"、学习大佬的技术博客、找开源代码等资料
系统入门到实战学习某项技术、有问题找"百度"、学习大佬的技术博客、找开源代码等资料
56 0
|
3月前
|
传感器 机器学习/深度学习 自动驾驶
百度Apollo:激光雷达检测技术深度解析
百度Apollo:激光雷达检测技术深度解析
49 2
|
3月前
|
传感器 自动驾驶 数据可视化
Apollo 开放平台9.0 :百度驾自动驾驶技术的全新升级(文末赠送apollo周边)
Apollo 开放平台9.0 :百度驾自动驾驶技术的全新升级(文末赠送apollo周边)
49 1
|
3月前
|
存储 监控 网络协议
百度基于金融场景构建高实时、高可用的分布式数据传输系统的技术实践
本文将通过一个百度搜索旗下的金融场景案例来分享构建高实时、高可用的分布式数据传输系统的技术实践。
51 0
|
5月前
|
存储 缓存 安全
百度搜索:蓝易云【【HTTP 协议】掌握 Web 的核心技术】
以上是关于HTTP协议的核心知识点,深入理解和掌握这些内容将有助于开发和管理Web应用程序。HTTP是Web开发的基础,熟悉其工作原理和相关概念对于构建高效、安全的Web应用至关重要。
39 2
|
6月前
|
数据库连接 数据库 Docker
百度搜索:蓝易云【Docker之Docker Compose技术详解。】
通过使用Docker Compose,你可以轻松地管理复杂的多容器Docker应用程序,定义它们之间的关系和依赖,简化部署过程,提高开发效率。你可以根据具体的需求和场景,在YAML文件中定义适合你应用程序的服务、网络、卷等配置,从而实现容器化应用程序的构建和管理。
136 0
|
8月前
|
域名解析 缓存 网络协议
百度统一socket长连接组件从0到1的技术实践
本文旨在探讨socket长连接技术在移动端的实践,并以iOS端为例,重点分享了百度在实现统一socket长连接组件过程中的技术选型和整体架构设计逻辑。并结合IM即时通讯聊天应用案例,展示长连接组件是如何在移动应用领域为类似业务场景提供解决方案的。
145 0
|
9月前
|
自然语言处理 API 开发工具
百度语言处理应用技术API:NLP开发SDK的简单调用
百度语言处理应用技术API:NLP开发SDK的简单调用
63 0
|
10月前
|
Web App开发 Linux
计算机技术|Aria2下载神器——突破百度云限速
计算机技术|Aria2下载神器——突破百度云限速
488 0