时空大数据要把握“后发优势”

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

“时空大数据”一词越来越得到测绘与地理信息界的认可,无论从哲学角度还是从科学和社会实践的角度,时空大数据的提出都是成立的。

当今社会的一个重要特点是,全球、国家(区域)、城市治理对时间和空间的依赖程度越来越高,时空大数据正日益成为治理体系和治理能力现代化的核心驱动力。

我国要深入研究时空大数据的科学价值与实践价值,走出一条从基础研究起步,融理论创新、技术创新、产品创新和服务模式创新于一体的中国特色时空大数据产业化之路。

数据与文化密不可分

什么是数据文化?一方面,数据活动过程离不开一定的文化背景;另一方面,数据活动过程又直接影响到整个社会文化的面貌。数据活动过程已经形成了一种特殊的文化,即数据文化。

当“一切靠数据说话,一切凭数据决策”成为一种社会现象时,就是数据文化的形成。但回顾历史,相较西方发达国家,我国仍是个数据文化相对匮乏的国家。

尽管2014年我国就首次将大数据写入《政府工作报告》,2015年国务院印发《促进大数据发展行动纲要》,2016年3月公布的国家《“十三五”规划纲要》中提出了“大数据战略及行动计划”,许多省(自治区、直辖市)也随之发布了有关大数据行动计划的文件,但是大数据理念、大数据意识、大数据思维尚未普遍建立。

近年来,大家都在谈论大数据,但仍然面临许多问题。比如,挂牌的大数据研究单位很多,但虚的多、实的少,大数据产业刚刚起步,更未形成产业链;试图掌握(拥有或占有)大数据的多,而真正应用大数据的少,有的甚至不知怎样应用大数据;数据分散、共享难、整合难,仍是突出问题。

这其中最根本的问题就是我国的数据文化尚未受到重视,大数据时代的到来给我们带来了很多跨越式发展的机遇,但如果我们没有大数据意识、大数据思维,归根结底没有(大)数据文化,那么“后发优势”也不可能转变成“现实优势”。

所以,我们要把“大数据”这个科技符号变成“数据文化”,即政府的文化、社会的文化和大众的文化。当然,这是一个长期的任务。

通往计算型的智能社会

不可否认,数据是记录历史和现实的最重要、最可靠、最好的方式;数据还是人类知识的来源,现代意义上的大数据将逐渐成为人类全部认识的来源;而且,还可以用数据训练机器(计算机),使机器获得智能,即计算机人工智能。

摩尔定律,使得人类保存数据的能力增强;社交网络,使得人类生产数据的能力增强;数据挖掘,使得人类使用数据的能力增强。它们被称之为“改变世界的三股力量”,标志着大数据时代的到来。

有数据,必须有计算,这就是计算型社会的兴起,越来越多的社会问题都可以通过计算来解决,同时物理环境领域的计算也面临着一些革命,安置在各类物体上的传感器,万物皆联网,无处不计算,这就是普适计算。无人(自主)驾驶,让数据训练机器使之获得智能,通过大数据的整合和挖掘发现知识,实现“1+1>2”的增值效果。

大数据是什么并不重要,重要的是大数据时代改变了人们的思维模式、管理模式、商业模式。大数据时代每一个新名词的出现,都将预示着一种趋势,并极可能成为改变未来的驱动力。

5月25日贵阳大数据博览会期间,大数据战略重点实验室和全国科学技术名词审定委员会发布的“大数据十大新名词”,即块数据、主权区块链、轶序互联网、激活数据学、5G社会、开放数据、数据交易、数据铁笼、数据安全、数权法,既揭示了大数据的时代特征,又反映了大数据的发展趋势。

“大数据十大新名词”的发布,代表了中国在实施大数据战略方面取得的成绩,说明中国在推动大数据发展中抢占了理论创新、实践创新和规则创新的制高点,正开启信息时代的数据文化。

时空大数据面临机遇

中国虽然在数据文化上相对滞后,但却占有“后发优势”。时空大数据时代的到来,使我们面临前所未有的机遇。

为什么要提出“时空大数据”?当今社会的一个重要特点是,世界管理和全球治理、区域管理和区域治理、国家管理和国家治理、城市管理和城市治理等,对时间和空间的依赖程度越来越高,时空大数据正日益成为全球、地区、国家、城市治理体系和治理能力现代化的核心驱动力。

空间与时间一起构成运动着的物质存在的两种基本形式。空间指物质存在的广延性;时间指物质运动过程的持续性和顺序性。空间和时间具有客观性,同运动着的物质不可分割。没有脱离物质运动的空间和时间,也没有不在空间和时间中运动的物质。空间和时间也是相互联系的。

随着智能感知技术、物联网等技术的发展,各个领域开始了“量化”的进程,这种一切皆可“量化”的趋势导致大规模海量数据的产生,而空间参照与时间参照是大数据的两个基本特征。

从可视化角度讲,正是因为一切大数据都具有空间参照与时间参照特征,才能直观地为人们提供大数据的空间位置、空间分布和时间标识。

变“后发优势”为“现实优势”

时空大数据的产业化是一个新问题,我们应该走一条从基础研究起步的理论创新、技术创新、产品创新和服务模式创新的产业之路。以推动国家治理体系和能力现代化为目标,以新型智慧城市建设为抓手,把时空大数据的应用作为重中之重,切忌面子工程、切忌政绩工程。

在理论创新上,围绕时空大数据科学理论体系、时空大数据计算系统与科学理论、时空大数据驱动的颠覆性应用模型探索等开展重大基础研究,构建时空大数据基础理论与方法体系。

在技术创新上,采用政产学研用相结合的协同创新模式和基于开源社区的开放创新模式,围绕时空大数据存储管理、时空大数据智能综合与多尺度时空数据库自动生成及增量级联更新、时空大数据清洗、数据分析与挖掘、时空大数据可视化、自然语言理解、深度学习与深度增强学习、人类自然智能与人工智能深度融合、信息安全等领域进行创新性研究,形成时空大数据技术体系。

在产品创新上,围绕时空大数据获取、处理、分析、挖掘、管理、应用等环节,研发时空大数据存储与管理软件、分析与挖掘软件、可视化软件等软件产品与软硬件集成产品和多样化数据产品,提供时空数据与各行各业大数据、领域业务流程及应用需求深度融合的时空大数据解决方案,形成比较健全实用的时空大数据产品体系。

但是要在全球化竞争中把握住这种“后发优势”并不容易。大力推进数据文化建设、提高国人数据文化素质,是加快时空大数据发展的根本。

国家之间的竞争,表面上是科技、经济竞争,但归根结底还是国民素质和文化的竞争。没有一个健康、理性、与时俱进的文化,一个国家就难以变得很强大。为此,我们一定让时空大数据走出“学院式”的象牙塔,变成一个大众的话题,使数据文化进入国人的视野,融入国人的意识和血液。

(作者系中国工程院院士,本报记者李惠钰根据其在第十一次全国测绘科技信息交流会上的报告整理)

本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
1月前
|
存储 运维 物联网
长安汽车×云器Lakehouse一体化数据平台,成本降低50%,建立智能互联时代的领先优势
长安汽车智能化研究院致力于汽车智能化技术研究,通过构建基于云器科技Lakehouse一体化数据平台,解决了高并发、大规模车联网数据处理难题,实现了数据实时写入、高效分析和成本优化,助力汽车智能驾驶、网联和交通全面发展。
53 0
长安汽车×云器Lakehouse一体化数据平台,成本降低50%,建立智能互联时代的领先优势
|
3月前
|
存储 分布式计算 大数据
阿里云 EMR 强势助力,与阿里云大数据体系共创辉煌,把握时代热点,开启生态建设之旅
【8月更文挑战第26天】阿里云EMR(Elastic MapReduce)是一种大数据处理服务,与阿里云的多个服务紧密结合,共同构建了完善的大数据生态系统。EMR与对象存储服务(OSS)集成,利用OSS提供可靠、低成本且可扩展的数据存储;与MaxCompute集成,实现深度数据分析和挖掘;还支持数据湖构建服务,加速数据湖的搭建并简化数据管理与分析过程。EMR提供多种编程接口及工具,如Hive、Spark和Flink等,帮助用户高效完成大数据处理任务。
106 2
|
3月前
|
分布式计算 大数据 数据处理
Apache Spark的应用与优势:解锁大数据处理的无限潜能
【8月更文挑战第23天】Apache Spark以其卓越的性能、易用性、通用性、弹性与可扩展性以及丰富的生态系统,在大数据处理领域展现出了强大的竞争力和广泛的应用前景。随着大数据技术的不断发展和普及,Spark必将成为企业实现数字化转型和业务创新的重要工具。未来,我们有理由相信,Spark将继续引领大数据处理技术的发展潮流,为企业创造更大的价值。
|
3月前
|
分布式计算 大数据 API
|
4月前
|
存储 SQL 分布式计算
MaxCompute的优势
【7月更文挑战第1天】MaxCompute的优势
80 0
|
6月前
|
存储 NoSQL 大数据
新型数据库技术在大数据分析中的应用与优势探究
随着大数据时代的到来,传统数据库技术已经无法满足海量数据处理的需求。本文将探讨新型数据库技术在大数据分析中的应用情况及其所带来的优势,为读者解析数据库领域的最新发展趋势。
|
6月前
|
分布式计算 资源调度 大数据
【大数据技术Hadoop+Spark】Spark架构、原理、优势、生态系统等讲解(图文解释)
【大数据技术Hadoop+Spark】Spark架构、原理、优势、生态系统等讲解(图文解释)
1460 1
|
6月前
|
存储 安全 大数据
【云计算与大数据技术】云交付模型、云部署模型、云计算优势与挑战、应用的讲解(超详细必看)
【云计算与大数据技术】云交付模型、云部署模型、云计算优势与挑战、应用的讲解(超详细必看)
1099 0
|
存储 分布式计算 数据挖掘
maxcompute优势
MaxCompute作为阿里巴巴集团内部核心大数据平台,具有以下优势: 1. 存储及计算能力:MaxCompute具备万台服务器扩展能力和跨地域容灾能力,能够承担集团内部绝大多数的计算任务,支撑每日百万级作业规模,适用于100GB以上规模的存储及计算需求,最大可达EB级别,并支持多种计算模型如SQL、MapReduce、Graph等及MPI迭代类算法。 2. 高效的数据处理能力:MaxCompute可以快速处理海量数据,减轻企业数据处理负担。 3. 自动调整存储成本:MaxCompute可以根据数据的访问频率和重要性,自动调整存储成本,降低企业数据存储成本。 4. 实时数据分析:MaxCom
122 3
|
机器学习/深度学习 SQL 分布式计算
「大数据分析」寻找数据优势:Spark和Flink终极对决
「大数据分析」寻找数据优势:Spark和Flink终极对决
下一篇
无影云桌面