连接地方,百度地图如何构筑大数据王国?

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

昨天,百度地图与成都交警、成都交投签署合作协议,建立战略合作伙伴关系,成都交警将向百度开放公共交通大数据,让百度地图给用户提供更加便利的地图服务,如实时路况;而百度则将提供云计算、大数据和人工智能等领域的技术,协助成都交警实现宏观决策、信息化管理和精准治理。

这则新闻有一些似曾相似。没错,自从去年底与江苏交通运输厅战略合作之后,百度地图与地方交通部门合作正逐步走向常规化,就在5月百度地图还与海口交警达成了合作,合作模式可谓大同小异:政府部门与百度地图共享各自拥有的交通数据,百度还会共享其技术和海量用户。百度地图与地方交通管理部门合作,已不再是“亮点案例”,正在成为一种“标准模式”。

在科技圈,大数据并不是一个新鲜词汇,有一定规模用户的互联网平台均会对外宣称自家在挖掘大数据。即便如此,大数据对于大多数互联网平台来说,都只是在某些特定领域发挥了作用,比如腾讯借助于大数据提升社交广告效果,再比如滴滴借助于大数据动态定价,大数据只是“下午茶”。百度地图频繁地与地方交通管理部门围绕交通大数据展开合作表明,其已将大数据当“正餐”。

为什么百度地图如此重视大数据?

首先要明确,地图本身是一个“数据驱动型”应用,图层数据是地图平台最核心的资产,不断更新和丰富图层数据才能构成壁垒;其次地图不只是有海量数据,其本身就是“大数据应用”:它需要对海量数据进行处理,例如路径规划、POI查询、精准推荐等等,用户使用每一个功能,背后都是海量数据的应用;最后,在中国百度是探索大数据最积极的互联网巨头,搜索引擎就是一个大数据应用,百度翻译、百度语音等产品均是大数据应用,百度还拥有大数据实验室。百度地图被百度视作是移动端三大入口之一,有大数据的特性,自然就成为百度大数据实践的桥头堡。

百度围绕着地图有诸多大数据实践案例。

2014年,百度迁徙项目通过CCTV等重量级媒体惊艳亮相,引发热议,这一大数据应用的本质是借助于百度地图海量LBS轨迹数据,实现“人流移动的预测、追踪和呈现”。百度今年又开展了“预防踩踏事故”的研究,通过路径搜索数据与目标地点的人口密度的关联计算,就可预测特定时间在特定地方的人群聚集状况,例如两个小时后有多少人会前往外滩,这个数据可开放给交通管理部门进行预防疏导。“人流预测技术”还可被用作商业,例如百度热力图可帮助商家预测人流聚集和流动情况,这些数据还能进一步帮助店铺选址、公交选站、促销选点,甚至帮助政府了解区域房屋空置率。

然而,百度地图并不满足于对自有大数据进行挖掘,而是对交通部门的公共交通数据保持饥渴。

很多人没有留意到,拥有最多大数据的不是BAT这类互联网巨头,而是政府部门。以交通运输部门为例,其可通过道路摄像头、出租车GPS、交通事故记录等方式采集大量的交通数据,其还拥有交通基础设施最新的数据,也有能力去要求公共交通单位如地铁公交公司提供各种数据。这些数据如果能“取之于民用之于民”便有巨大的价值,在广州,在主干道上已经能够看到实时路宽信息、CBD停车场车位信息,交通大数据已通过道路大屏幕开放给市民,然而,这种开放非常有限,交通大数据大多还在沉睡,价值完全没有释放。

看中这一点的百度,对于交通部门的公共数据是十分饥渴的,因此不断寻求地方交通管理部门与之合作。公共交通大数据与百度用户大数据结合起来会有难以估量的价值,具体来说,体现在这些方面:

1、大幅提升用户出行体验:百度地图与江苏交通部门合作,接入南京实时公交数据之后,用户就可在百度地图查询公交实时到站信息。除了实时公交之外,与成都合作接入最新路网信息,地图导航就会第一时间知晓交通事故、道路维修、交通管制等情况进而绕行,进而提升出行体验。

2、提高日常交通疏导效率:基于互联网地图,交通信息不需通过大屏幕就可传达给司机。例如,交通部门可在云端疏导,司机则通过车载导航或手机地图收到语音指令,这样可避免让交警处于复杂恶劣的交通环境中。再比如有地方发生交通事故,用户可通过百度地图的个性化导航绕行。借助于互联网地图,交通部门信息将更有效地传达给市民,实现云端调度,提升道路资源的使用效率,降低城市拥堵程度。

3、辅助宏观交通规划决策:相当一部分交通问题,例如长期拥堵、事故高发,均可归结到交通规划不合理,包括城市规划、道路规划、方向规划、交通灯设置、道路转向设置等等。如果有了基于海量大数据的分析结果,就可更有效地进行交通规划决策,进而提升整体效率,尤其是公共交通规划,公交路线、地铁班线、出租车配额,诸多公共交通资源配置决策均可基于大数据进行。

4、为共享出行提供基础支持:共享出行已深刻改变了市民的出行,共享出行平台依赖地图进行派单、计费、导航,这是百度与Uber结盟的原因。专车是增加还是减少城市拥堵?专车如何派单和行走才能避免拥堵?通过地图大数据分析都会有答案。共享出行的本质是基于LBS的大数据出行方式,百度地图大数据与公共交通大数据结合之后,可为共享出行提供更好的支持。

5、无人车十分依赖公共大数据:百度是中国布局无人车最积极的巨头,无人车被视作是根治交通问题的终极解决方案:只有无人车的交通系统更效率、更安全、更环保。无人车要全面上路,必须依赖于政府部门提供的实时而全面的交通数据,否则无人车很可能会开进死胡同出不来,或者遇到道路维修造成无人车大堵车。基于公共交通大数据,无人车就能接受云端的准确调度,选择正确路线。或许,百度地图与各地交通部门合作还有一个目的就是为2020年量产的无人车铺路。

从百度地图频繁与交通管理部门合作的迹象来看,公共交通大数据与互联网大数据结合起来充分利用,正在发挥巨大价值,即能提升用户出行体验和效率,又可降低交警工作风险和强度,还有环保节能、促进消费等间接价值。我想,交通管理部门与互联网巨头合作建更是大势所趋。





====================================分割线================================


本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
SQL 分布式计算 大数据
MaxCompute中,可以使用Presto连接器与MaxCompute进行交互
MaxCompute中,可以使用Presto连接器与MaxCompute进行交互
180 1
|
2月前
|
消息中间件 资源调度 大数据
大数据-112 Flink DataStreamAPI 程序输入源 DataSource 基于文件、集合、Kafka连接器
大数据-112 Flink DataStreamAPI 程序输入源 DataSource 基于文件、集合、Kafka连接器
47 0
|
3月前
|
存储 SQL 分布式计算
Java连接阿里云MaxCompute例
要使用Java连接阿里云MaxCompute数据库,首先需在项目中添加MaxCompute JDBC驱动依赖,推荐通过Maven管理。避免在代码中直接写入AccessKey,应使用环境变量或配置文件安全存储。示例代码展示了如何注册驱动、建立连接及执行SQL查询。建议使用RAM用户提升安全性,并根据需要配置时区和公网访问权限。具体步骤和注意事项请参考阿里云官方文档。
393 10
|
4月前
|
分布式计算 并行计算 大数据
【数据挖掘】百度2015大数据云计算研发笔试卷
百度2015年大数据云计算研发笔试卷的题目总结,涵盖了Hadoop、Spark、MPI计算框架特点、TCP连接建立过程、数组最大和问题、二分查找实现以及灯泡开关问题,提供了部分题目的解析和伪代码。
56 1
|
5月前
|
JSON 分布式计算 大数据
MaxCompute操作报错合集之连接环境时,出现报错:TypeError: access_id and secret_access_key,该怎么解决
MaxCompute是阿里云提供的大规模离线数据处理服务,用于大数据分析、挖掘和报表生成等场景。在使用MaxCompute进行数据处理时,可能会遇到各种操作报错。以下是一些常见的MaxCompute操作报错及其可能的原因与解决措施的合集。
|
6月前
|
分布式计算 NoSQL 大数据
MaxCompute产品使用合集之自定义udf连接云上vpc网络的redis获取数据的步骤是什么
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
6月前
|
分布式计算 DataWorks 大数据
MaxCompute操作报错合集之连接Tableau时,遇到所有日期字段无法使用并报错,是什么原因
MaxCompute是阿里云提供的大规模离线数据处理服务,用于大数据分析、挖掘和报表生成等场景。在使用MaxCompute进行数据处理时,可能会遇到各种操作报错。以下是一些常见的MaxCompute操作报错及其可能的原因与解决措施的合集。
|
6月前
|
分布式计算 大数据 Java
MaxCompute产品使用合集之在datawoks的datastudio和odpscmd里执行时间没有问题,但是用jdbc连接大数据计算MaxCompute获取getdate()时间就不对,该怎么办
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
6月前
|
分布式计算 运维 DataWorks
MaxCompute产品使用合集之如何直接连接Tableau Cloud
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
7月前
|
分布式计算 大数据 MaxCompute
maxcompute配置问题之连接超时如何解决
MaxCompute配置是指在使用阿里云MaxCompute服务时对项目设置、计算资源、存储空间等进行的各项调整;本合集将提供MaxCompute配置的指南和建议,帮助用户根据数据处理需求优化其MaxCompute环境。
141 2
下一篇
DataWorks