大数据“热”的“冷”思考

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:       大数据的好处经常提及我就不说了,我想谈谈反思,算作冷思考吧:      1、大数据源于一个概念,但发展至今已经形成了以技术为基础的商业体系,并慢慢形成产业生态圈。这与前几年的“云计算”发展脉络如出一辙。

      大数据的好处经常提及我就不说了,我想谈谈反思,算作冷思考吧:

      1、大数据源于一个概念,但发展至今已经形成了以技术为基础的商业体系,并慢慢形成产业生态圈。这与前几年的“云计算”发展脉络如出一辙。云计算和大数据热的背后,是行业的萧条。回想十多年前IT蓬勃发展的黄金时代,不需概念提携就已然能够迅猛发展。如今,IT产业步入中年期,不来两剂猛药,怕是步履太过缓慢。

      2、大数据的实践,并非无源之水天上来,它依赖于企事业已有的信息化基础。我国很多企业和政府机构中,电脑是买了,系统是上了,但太过低端,大多都是只是业务流程的无纸化复刻而已,无纸化是信息化最低端的一个层次,不过实事求是地说,这就是现状。对于“大”数据而言,这些部门内的数据就是“小”数据。数据虽小,但也有价值,遗憾的是基本的完整统计分析功能都不一定具备,更高级的智能分析就更别提了;数据虽小,但如果部门内部的数据能够汇合起来,交叉关联,就能变成“中”数据,部门间的数据一起汇总,就能形成“大”数据。我国幅员辽阔,人口众多,办事机构数量也为世界之首。数据量多得是,但到处都是孤岛,处处都是竖井。大数据概念虽热,但更需脚踏实地稳步前行,不能刚学会走、立刻就想跑。

      3、大数据的运维需要复合型人才,中国教育提供的“合格产品”太少。既懂计算机又懂管理还要精通统计,同时具有良好的表达和操作能力,这样的人数量稀少,市面上有两类才子:一类是专才,只能独挡一面;一类是通才,夸夸其谈,似乎什么都会,啥都能干。其实,大数据之路,没有捷径,需要吃苦、能够实干。


    就先谈这些吧。欢迎大家的批评和建议。
相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
1月前
|
存储 NoSQL 大数据
大数据 数据存储优化
【10月更文挑战第25天】
80 2
|
2月前
|
存储 SQL 分布式计算
大数据中结构化数据
【10月更文挑战第18天】
97 4
|
2月前
|
XML NoSQL 大数据
大数据中半结构化数据
【10月更文挑战第18天】
120 4
|
存储 大数据
大数据数据存储的分布式文件系统的KFS
在分布式文件系统 KFS 中,数据的存储和管理是基于块的分布式存储。
180 0
|
对象存储 存储 分布式计算
JindoFS: 云上大数据的高性能数据湖存储方案
JindoFS 是EMR打造的高性能大数据存储服务,可以为不同的计算引擎提供不同的存储服务,可以根据应用的场景来选择不同的存储模式。在2019杭州云栖大会大数据生态专场,阿里巴巴计算平台事业部EMR团队技术专家殳鑫鑫和Intel大数据团队软件开发经理徐铖共同向大家分享了云上大数据的高性能数据湖存储方案JindoFS的产生背景、架构以及与Intel DCPM的性能评测。
16409 1
JindoFS: 云上大数据的高性能数据湖存储方案
|
大数据 数据挖掘 数据格式