大数据,该如何拥抱你

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

云上浙江,数据强省,这是互联网时代,浙江未来新的发展坐标。

浙江孕育了世界上最大的互联网公司之一的阿里巴巴,以大数据推动各产业跨界融合;浙江大数据洞察民生需求,在公用事业、健康医疗等领域创造出更加丰富的公共产品,老百姓有了更多的“获得感”;浙江还在全国率先实现服务和数据资源向公众开放,推动服务型政府的建设。本期经济周刊,我们聚焦时髦的大数据、云计算,本报记者专访了这一领域内资深、权威的专家,试图为读者展现大数据——这一时代利器给予未来的无限可能性。

大数据,该如何拥抱你

信息大革命告诉我们,“0”和“1”并不是简单的二进制数码,它可以在虚拟世界拼凑出一个多维全景的“你”。周五的下午,你开始为晚上的家庭聚餐发愁,赶紧在网上订上一桌美味的饭菜;等到晚上,你打开电脑,搜索适合周末出游的目的地;周六的中午,朋友圈里出现了你在周边乡村郊游的美图……这些寻常的生活场景用数据碎片进行记录连接之后,大数据所“掌握”的你就越来越有模有样。

当然,大数据的使命不止于认识“你”,更在于推动生产生活向着“你”的需求前进。6月29日,浙江大数据交易中心召开首届会员大会。这让人们看到大数据在我省从“认识”功能到经济社会“指挥棒、参与者”的全新转变,它出现在政府的便民服务中,出现在各种消费场景中,还出现在工业企业的车间流水线上。大数据产业,浙江究竟要如何拥抱你?

数据越交换越增值

“数据越交换才越增值,交易中心是数据共享运用的润滑剂。”省经济和信息化委员会总工程师厉敏说,数据之间是相关关系,交易中心给这种相关性提供了实现的平台。

今年3月,省政府批复同意筹建浙江大数据交易中心,由浙报传媒集团股份有限公司、百分点信息科技有限公司、浙商资本管理有限公司共同投资设立。时隔三个月后,我省首个大数据交易中心终于公布了《浙江大数据交易中心交易规则》等一系列规章,迎来首批签约的50多个会员单位。

简单来说,浙江省大数据交易中心,是一个促进数据提供方和需求方找到交易匹配、完成数据交易的交换平台,也是一个提供数据加工、整合、脱敏、模型构建等服务的数据管理平台。

放眼全国,浙江的大数据交易中心来得不算早,却是恰当其时。在首批入驻交易中心的会员单位中,数据提供方和需求方的边界已不明显。“运营商、医疗服务公司、金融机构等,他们既是供应方也是需求方,都在期待数据交互后的化学反应。”浙江大数据交易中心副总经理来磊介绍,交易中心是为促进数据资产商品化,更是为了让游散在各个市场主体手上的数据资源化为产业转型升级的科学依据。

相比以往采用随机抽样的方式,大数据是对所有的数据进行超级运算分析。美国奈飞公司翻拍的电视剧《纸牌屋》之所以大获成功,就是因其在演员选择、情节发展、播放方式上信任了大数据分析,通过对3000万人次的观影行为、400万次的影评和300万次的搜索请求抽丝剥茧最终确定。

大量、高速、多样、价值、真实。不可否认,大数据带来的信息风暴正在变革我们的生活、工作和思维。2014年5月,我省出台《关于加快发展信息经济的指导意见》,率先提出加快发展信息经济,抢占未来发展制高点;2016年3月,我省发布《浙江省促进大数据发展实施计划》,提出要把我省打造成全国大数据产业中心。

“其实交易中心提供的是一个数据公开流通的平台,未来我们还将围绕交易中心打造一个产业生态圈。”来磊说,浙报传媒正在建设的“富春云”互联网数据中心项目,将形成6000个机柜、近10万台服务器的服务能力,提供云基础设施、大数据交易配套等数据服务;同时,浙报传媒还将打造孵化器模式的大数据创客中心,设立总额10亿元人民币的大数据产业基金,形成覆盖大数据全产业链的开放性生态系统。

孤岛数据亟待解封

互联网在塑造“地球村”的同时,早已打通信息壁垒,在新技术的追求上,国内和国外的差距并不远。

就目前来看,全球的大数据产业还处于发展初期,我国的大数据产业才刚刚起步。依托于信息技术产生的大数据产业,不同于传统产业,对资源要素依赖较小,各地竞相布局,谋取先发优势。

在贵州,现在有一个新词儿,叫“贵漂”。贵州是国内提出发展大数据产业较早的省份,大量网络信息技术的使用让贵州开辟出一条以现代科技为主的发展路径。交易中心的一位工作人员告诉记者,印象中青山秀水的地方,如今已变成年轻人创业的新天地。

然而,对大数据的利用并非短时间内就可以完全驾驭,大数据产业的发展在未来仍有许多挑战。

厉敏认为,首先在于政府和公共数据没有完全开放共享。各级政府机构拥有海量的原始数据,如气象、人口、环境、土地等公共数据,安全、海关、旅游等管理数据,教育、医疗、金融等服务数据,这些构成了社会发展与运行的基础。“当数据在具体的政府单一部门时,产生不了任何价值,但如果将这些数据进行关联分析, 将产生巨大的社会价值和经济效益。”厉敏说,停留在“孤岛”上的数据亟待解封。

浙江在全国率先启动的政府自身改革“四张清单一张网”,其中的“一张网”——浙江政务服务网,便是政府数据开放共享的一次尝试。在诸暨市办证中心,工作人员办理建筑施工企业安全生产考核合格证书的延期手续。材料通过浙江政务服务网上传后,不到10分钟,企业就领到了证书。上线两年多来,这些数据从50多个孤立的省级机关大楼机房出发,被转移到浙江电信和华数集团其中的专用数据中心,打破部门数据壁垒。

去年10月,我省成立全国首个省级数据管理中心,通过政务服务网的数据交换,省级中心可以和全省90个县市,43个部门窗口,实现信息资源实时共享应用。即便如此,政府的数据大迁徙也才刚刚起步,资源整合仍是未来相当长时间内的重要工作。

其次是数据的质量。中国工程院院士汪应洛认为,数据质量是大数据产业这座大厦的基础,但如果数据质量不高、基础不牢靠,大数据产业就可能岌岌可危。

还有一点,是对个人隐私保护的挑战。正如开篇所提及的,大数据通过碎片化信息的拼凑可以推理出一个几乎“原版的你”,而大数据治理、个人数据保护相关的法律法规还未跟上产业前进的步伐。在数据共享、开放的背景下,不仅政府机构之间、企业不同模块之间需要数据共享,不同企业之间也会形成共享,这样一来,只要某个数据库出现安全漏洞,个人隐私或企业商业秘密的泄露将可能是全方位的。

大数据孕育生态圈

6月29日,省旅游局发布《关于全省旅游基础数据库建设的通知》,其中提到,到2017年我省旅游基础数据库覆盖面要达90%以上,初步建成全省旅游产业信息服务平台。

“旅游大数据的应用,恰巧反映出我省在大数据产业布局上正在抓紧推进的几件事。”厉敏说,数据源的获取需要强大的基础设施网络,从“宽带浙江”到“云上浙江”、“智慧浙江”,我省正在努力提高数字传输主干网容量和传输速率,在基础设施上保障产业发展;同时成立相关部门和培养龙头企业,对海量数据存储、数据挖掘、图像音视频智能分析、信息传输、信息安全等技术研发领域进行统一协调和管理,引领示范。

大数据产业在浙江,有其先天优势。如杭州,云集了阿里巴巴、网易、海康威视、华三通信等行业龙头企业,形成了“阿里云”、 华数为代表的云服务基础设施提供商,以华三为代表的云服务提供商,海量的云应用企业构建了较为完整的大数据产业链。省经信委信息化基础设施处负责人告诉记者,前段时间工信部在各省征集大数据产品、服务平台和解决方案的优秀案例,原本十个配额,我省申报了四十多项。

在近日的云栖大会·成都峰会上,浙江华禹科技有限公司宣布,经过紧张的封闭研发,多套天气水利系统在阿里云市场已紧急上线,可帮助政府实现对城市积水深度预测、台风路径预测等。华禹科技在阿里云发布的台风路径查询分析系统,收集了自1945年以来所有影响中国的百余个台风的行走路径、风力风速、水雨等情况。一旦有新的台风生成,系统就可以通过阿里云的机器学习算法同历史台风库进行对比。1秒内计算出最相似台风,为预测汛情提供参考。

虽然互联网企业天生就有大数据的基因,但大数据可能带来的巨大价值也正在被传统制造业所认可。

大数据之于传统制造业,正是“中国制造2025”对于智能制造的呼唤。比如,在设备运行的过程中,通过传感器技术实时感知数据,使得生产过程中的突发因素能被精确控制,一条条柔性生产线出现在浙江的工业企业车间;又比如,对制造业大规模定制中的大数据进行挖掘后,实现了流行预测、精准匹配、营销推送等,让不少企业找到供给侧改革的方向,找到“浙江智造”的信心。

====================================分割线================================

本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
7月前
|
分布式计算 NoSQL 大数据
大数据介绍
大数据介绍
68 1
|
SQL 分布式计算 大数据
大数据初了解
了解大数据行业
125 0
|
大数据
大数据的深入理解
大数据的概念、作用、应用
198 0
|
存储 分布式计算 大数据
深入理解大数据
大数据的定义、采集、应用、意义和前景
203 0
|
SQL 存储 大数据
ROLAP与大数据
大数据相关的场景比较多,常见的有:ETL(数据提取、转换、加载)、实时流式(监控报警、风控等)、机器学习(推荐引擎、用户画像等)、非结构化分析(视频、图片、语音、文本等)、海量大数据在线存储(HBase)、搜索及我们本文讲的OLAP。 其中OLAP(在线联机分析)在很多企业占住分析类的大部分。
6574 0
|
新零售 存储 Java
关于大数据最常见的10个问题,必看!
1、云计算与大数据是什么关系?   云计算的关键词在于“整合”,无论你是通过现在已经很成熟的传统的虚拟机切分型技术,还是通过google后来所使用的海量节点聚合型技术,他都是通过将海量的服务器资源通过网络进行整合,调度分配给用户,从而解决用户因为存储计算资源不足所带来的问题。
1306 0
|
存储 人工智能 大数据