大数据时代政府应整合公共数据

简介:   近日,中国工程院院士、中国互联网协会理事长邬贺铨做客深圳罗湖区委,为该区领导干部上了一堂科普讲座。在邬贺铨看来,大数据时代既为政府决策提供了更多有价值的参考,也需要政府对公共数据进行整合和开放。
0.jpg

  近日,中国工程院院士、中国互联网协会理事长邬贺铨做客深圳罗湖区委,为该区领导干部上了一堂科普讲座。在邬贺铨看来,大数据时代既为政府决策提供了更多有价值的参考,也需要政府对公共数据进行整合和开放。

应用大数据可让政府决策更明智

  “大数据”究竟有多大?邬贺铨介绍,2011年,全球数据规模为1.8ZB,可以填满575亿个32GB的iPad,这些iPad可以在中国修建两座长城。到2020年,全球数据将达到40ZB,如果把它们全部存入蓝光光盘,这些光盘和424艘尼米兹号航母重量相当。最近两个月在YouTube上传的视频超过了ABC、NBC和CBS电视台自1948年以来连续播出的内容。

  如恒河沙般的数据可以为我们带来什么?邬贺铨介绍,大数据的意义不在于庞大的数据信息,而在于对其中富有意义的数据进行专业化处理,这好比沙里淘金。

  例如,利用购物推车获得商场顾客在各处的停留时间,利用视频软件分析其购物行为,就可以优化商场布局和货架排列;分析几十年来的天气数据,将各地降雨、气温、土壤状况和历年农作物产量做成精密图表,就可以预测农产品生产趋势,政府的激励措施、作物存储量和农业服务也可以随之确定。

  前不久深圳地陷频发,几乎都因地下管道老化所引起。邬贺铨说,大数据技术所包含的智能监视,可以用于监视地下管线、地铁施工、矿山安全等。同样,这样的技术还可以监测水体、建筑能耗、交通、医疗、工业生产、电网……通过使用大数据,政府可以预测就业率、改进城市道路设计等。

  “大数据还可以帮助政府改进治安管理和社会管理的手段。”邬贺铨介绍,去年美国加州大学的人类学和数学家共同建立了犯罪活动预测平台。通过分析过去1300多万起案件,寻找发案与日期、天气、交通状况及其他相关事件的关系。警方每天会按照该系统发出的巡逻指令前往指定小区,在不增加警力的情况下,洛杉矶的财产犯案率和盗窃案件分别下降了12%和16%。

政府应打破壁垒,整合开放公共数据

  “大数据时代,政府应该对公共数据进行整合和开放。”邬贺铨认为,作为改革开放前沿的罗湖区可以做出这样的尝试。

     据介绍,美国联邦政府建立了“Data.Gov”网站,开放一些公共数据并鼓励挖掘。截至2011年12月,该网站共有3721项原始数据、386429项地理数据、1570个数据可视化应用。人们可以从这些数据中找出空气质量与工厂数量、胖子数量与快餐店多寡等关联。这对经济、环保等领域的研究有着非凡的意义。

  邬贺铨指出,目前国内政府部门拥有大数据,但以邻为壑、共享难,“有数据的不挖掘,会挖掘的没数据”,这导致了信息不完整或者重复投资。另一方面,大数据挖掘缺乏相应的立法,无法既保证共享又防止滥用,而中国能理解和应用大数据的人才更是稀缺资源。

  “开放公共数据并不会侵犯公民个人隐私。”邬贺铨分析,例如,若街道能够公布老人、年轻人、入学儿童的人数和总人口中的占比,将更有利于商家、公益组织、学术团体的决策。对建设“国际消费中心”的罗湖而言,这些公共数据将对零售和服务行业大有裨益。


原文发布时间为:2013-08-1


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
2月前
|
分布式计算 DataWorks IDE
MaxCompute数据问题之忽略脏数据如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
47 0
|
2月前
|
SQL 存储 分布式计算
MaxCompute问题之下载数据如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
38 0
|
2月前
|
分布式计算 关系型数据库 MySQL
MaxCompute问题之数据归属分区如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
35 0
|
3月前
|
机器学习/深度学习 存储 分布式计算
机器学习PAI关于maxcompute上用protobuf 处理数据,比较方便的方式
机器学习PAI关于maxcompute上用protobuf 处理数据,比较方便的方式
|
2月前
|
分布式计算 DataWorks BI
MaxCompute数据问题之运行报错如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
38 1
|
4月前
|
存储 SQL 大数据
dataCompare大数据对比之异源数据对比
dataCompare大数据对比之异源数据对比
104 0
|
2月前
|
分布式计算 关系型数据库 数据库连接
MaxCompute数据问题之数据迁移如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
34 0
|
2月前
|
分布式计算 Cloud Native MaxCompute
MaxCompute数据问题之没有访问权限如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
38 0
|
9天前
|
数据采集 搜索推荐 大数据
大数据中的人为数据
【4月更文挑战第11天】人为数据,源于人类活动,如在线行为和社交互动,是大数据的关键部分,用于理解人类行为、预测趋势和策略制定。数据具多样性、实时性和动态性,广泛应用于市场营销和社交媒体分析。然而,数据真实性、用户隐私和处理复杂性构成挑战。解决策略包括数据质量控制、采用先进技术、强化数据安全和培养专业人才,以充分发挥其潜力。
13 3
|
11天前
|
运维 供应链 大数据
数据之势丨从“看数”到“用数”,百年制造企业用大数据实现“降本增效”
目前,松下中国旗下的64家法人公司已经有21家加入了新的IT架构中,为松下集团在中国及东北亚地区节约了超过30%的总成本,减少了近50%的交付时间,同时,大幅降低了系统的故障率。