【深度】另类视角看百度迁徙图

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:  【CCTV的赞誉】摘自CCTV晚间新闻         今天全国春运已经进入第10天,越来越多的人通过海陆空不同的方式往家里赶。36亿春运大军里面哪条返乡之路最热?不同的旅游线路的人们又有哪些特别的故事?“据”说春运,让我们用数据说说春运背后的故事。

 【CCTV的赞誉】摘自CCTV晚间新闻
        今天全国春运已经进入第10天,越来越多的人通过海陆空不同的方式往家里赶。36亿春运大军里面哪条返乡之路最热?不同的旅游线路的人们又有哪些特别的故事?“据”说春运,让我们用数据说说春运背后的故事。30年来,春运大军从原来的1亿人次,增长到今天的36亿人次,在春运这么短的时间内,36人次的大迁移,在过去我们真的很难去想象全国到底是怎样的景象?感谢大数据,在2014给我们带来最为直观的感受,下面这张图是百度提供的迁徙动态图,这些美丽的亮线就是春运路上大家的足迹,如果您使用过智能手机,并使用过定位功能的话,那么从您踏上旅途的那一刻开始,从出发地到目的地的数据就会在这张图上画出一条淡淡的线,人越多,这条线就会越亮。
大数据还告诉了我们什么,首先是最热线路排行榜,截止到今天晚上7点,8小时内排在前三位的是上海到滁州,天津到德州,还有成都到北京,一个非常有意思的发现是,成都往返北京的线路已经连续占据热门线路的前十名,昨天甚至排名第一位。橙色的线代表迁入成都的人流,而黄色的线代表迁出成都的人流量。

        但是我们发现,不管到达还是出发,成都站都很热,而成都铁路局统计的数据也恰恰印证了这一点,从春运当天开始一直到昨天晚上8点,从成都火车站直达北京的人数为7335人,增幅较2013年超过60%,要知道春运30多年来,没到春运的前半段,差不多是这个时候,成都站所面临的最大压力是到达客流所带来的,但是今年,他们在原来的基础上,在送出旅客方面,同样投入更多的精力,也许呢,大数据到现在还不能具体的分析出乘车人的身份,不过成都火车站的一线人员有个特别的发现,那就是今年出发的人流当中,多了很多老人的面孔,而这在以前并不多见,老人们挤进春运大军都是要去儿女打工的城市准备过年,这样充分印证了专家的分析:逆向迁徙正在改变着今年的春运......

 

【我的疑惑】

  1. 为何是百度?从央视的报道可知,百度的算法是近似算法,前提是要用智能手机且使用过定位功能,有了这两个前提,百度才可以采集到所需数据,近似估计出哪部手机可能从哪出发到哪回家,才能画出这壮观精美的图画,但是从整合社会资源的角度看,这是巨大的浪费,因为百度所有需要的数据,铁路局都有,而且不是近似值,是精确值,清楚知道每个乘客的年龄、籍贯、性别、出发地、中转站、目的地,所以我要问:为什么是百度画出了这张图,而不是你,铁路公司!

  2. 新闻应该多严谨?如果要说明“逆向迁徙正在改变着今年的春运",至少应该拿些数据说话,到底今年春运这段时间有多少人“逆向”,有多少老人“逆向”?而不是仅凭火车站一线人员的某些“特别”发现。况且,老人一般都会与打工者错峰出行,未必使用智能手机,也不一定会用定位功能。而且,“逆向迁徙”这词可不是今年才开始用,搜搜百度“春运 逆向迁徙”,满眼都是去年春运的文章!所以建议,新闻应该严谨的要传达准确含义,应多做功课,不能只做“新”而不用“心”!

  

【老读悟的担忧】以下内容为授权转载

摘自:老读悟(微信公号:laoduwu666,博客:http://data12345.com/)

一种失望和担忧——再谈大数据的价值

       一个央视和某巨头的合作项目,一个大数据、高科技风口浪尖的项目,顷刻间,各大小媒体的铺天盖地的称颂、赞美之词溢于言表,这是要“刷媒体”的趋势啊,仿佛大家都要说的什么,而我也要说点什么,说点做项目、做产品的初心,说点对国内大数据未来的担忧。
百度迁徙确实做了一些东西,海量数据的小时级处理,一定的可视化技术。但无论从项目思想、还是可视化的主体而言,都不是什么创新的东西,类似的、雷同的东西,相信从业者几年前就见过。并且,最重要的,它说到底是一个事后对数据的描述和展示,目前阶段的实际价值能有多大?对解决老百姓息息相关的春运问题的实际价值点在哪里?对政府的资源调配、社会决策能有多少立竿见影的效果?从现实情况看,恐怕还是新闻效应、政府关系效应效果更明显一些。
       当然,这些都没有问题,毕竟有了新的数据、新的信息可参考,聊胜于无。但回归做产品、做项目的初心,我们为什么要做这样一个项目,真的是在为用户解决痛点问题吗?
       大数据产品也是如此,真的是在用大数据为潜在用户解决实际问题吗?从大数据的概念提出,到目前也有几年时间了,国内一直处在“谈必大数据”的概念炒作阶段,不知道造就了多少砖家、叫兽。就拿春运来说,老百姓面临的问题是什么?怎么回,什么时候回,怎么中转,怎么抢到票,怎么避开中途可能的异常情况,甚至配套的黄牛识别问题,这些都是和大数据息息相关的,怎样采集更广泛的外部数据,怎样构建模型发挥大数据的分析及预测价值,怎么通过大数据产品的可视化技术连接用户,都是要考虑的环节。
       对政府类用户而言,也有各种各样的问题需要大数据支持:各种交通资源的调配问题,特定交通线路的最优设计问题,异常时间的实时定位问题,交通拥堵的预测问题,甚至春运问题与老百姓满意度的问题,等等。
       报个创新,搞个公关,这些真的不是最重要的,请回归做产品的初心吧。也期待大数据从业者可以从价值出发,推动国内大数据产业的良性发展,驱动更有价值大数据产品出现。


原文发布时间为:2014-01-27


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
域名解析 负载均衡 网络协议
阿里云基础设施网络研发团队参与论文获得CCS 2023 杰出论文奖
阿里云基础设施网络研发团队参与论文获得CCS 2023 杰出论文奖
|
存储 JSON NoSQL
Redis常见命令大全
【7月更文挑战第30天】
131 3
|
9天前
|
人工智能 运维 安全
|
7天前
|
人工智能 异构计算
敬请锁定《C位面对面》,洞察通用计算如何在AI时代持续赋能企业创新,助力业务发展!
敬请锁定《C位面对面》,洞察通用计算如何在AI时代持续赋能企业创新,助力业务发展!
|
8天前
|
机器学习/深度学习 人工智能 自然语言处理
B站开源IndexTTS2,用极致表现力颠覆听觉体验
在语音合成技术不断演进的背景下,早期版本的IndexTTS虽然在多场景应用中展现出良好的表现,但在情感表达的细腻度与时长控制的精准性方面仍存在提升空间。为了解决这些问题,并进一步推动零样本语音合成在实际场景中的落地能力,B站语音团队对模型架构与训练策略进行了深度优化,推出了全新一代语音合成模型——IndexTTS2 。
681 23
|
8天前
|
人工智能 测试技术 API
智能体(AI Agent)搭建全攻略:从概念到实践的终极指南
在人工智能浪潮中,智能体(AI Agent)正成为变革性技术。它们具备自主决策、环境感知、任务执行等能力,广泛应用于日常任务与商业流程。本文详解智能体概念、架构及七步搭建指南,助你打造专属智能体,迎接智能自动化新时代。
|
14天前
|
人工智能 JavaScript 测试技术
Qwen3-Coder入门教程|10分钟搞定安装配置
Qwen3-Coder 挑战赛简介:无论你是编程小白还是办公达人,都能通过本教程快速上手 Qwen-Code CLI,利用 AI 轻松实现代码编写、文档处理等任务。内容涵盖 API 配置、CLI 安装及多种实用案例,助你提升效率,体验智能编码的乐趣。
1113 110