怎么给大爷讲清楚“什么是大数据”?彭文华

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 怎么给大爷讲清楚“什么是大数据”?彭文华

这是彭文华的第131篇原创

前几天老家有事,不得已回去了一趟。疫情影响,一路都是严防死守,到家也一直戴着口罩,一刻也不能松懈。

在家少不了话话家常,话题正好聊到我公众号上。我大伯就问了个问题:“文华,你给我讲讲这大数据到底是个什么玩意啊?”我这顿时就愣住了,大脑开始疯狂的思考,半晌没搭话。这帮大爷一点技术基础都没有,各种概念都没接触过,这咋说啊?我总不可能从大数据的4个V开始说吧?




用场景解释

五叔看我有些尴尬,赶忙来打圆场:“这大数据可是很高深的东西,怕是一两句话说不清楚啊”。

五叔退休前是矿场的总工程师,这是个好切入口,大数据在矿场也是有应用场景的。

我整理了一下思路:“五叔你在矿上,开采前得到处探矿,开采时得安全生产。以前的信息都是一点点探出来的,安全生产也是靠人盯着,有点信息就记到本本上。如果有一个非常厉害的东西可以自动搜集各种数据,然后加以利用,这就是大数据了

我比划了一下坑道:“比如我们可以在坑道里放置瓦斯探测器、压力传感器各种探测器,实时收集坑道里的瓦斯浓度、压力传感器等信息,然后监控起来,1秒甚至10微秒一计算,一旦数值超过阈值,报警信息立刻通过各种各样的方式传播出去。这些数据也会留下来,以后可以进行进一步分析。因此大数据会涉及到各种各样的新技术,让系统可以存储特别特别多的数据,让报警特别快的反应,发现数据中更多更有价值的信息。你看,我这么说,大数据的4个V都体现了。

五叔说:“我们之前也用其他方式实现过坑道的预警,而且在地下的信号传输不太方便,不过我大致已经知道是这么回事了。可是其他叔叔伯伯估计还是不太懂啊

我蒙圈了,也是哦。这咋整?


大数据是个法器

大伯是英语老师,二伯是建筑工人,职业都不一样啊,我总不可能挨个说一遍各自行业的应用场景吧。我又开始发呆了。正巧旁边神叨叨的二姐正在给小外甥讲故事:“这孙悟空跑地府去,把阎罗王揍了一顿,找到生死簿,把猴子猴孙那几页全给撕掉了....”。嘿,我这灵感就来了~~

我说:“我们中国现在14亿人口,阎王爷的生死簿得多厚啊?要擒一个人怎么办?还有,那么多一样名字的嘞,擒错了怎么办?

我妈是个资深佛教徒,赶忙摆摆手:“阎王爷的生死簿那是个法器,多少人都能装进去。擒人的时候还要加上生辰八字和地址咧!”

我说:“对啰!大数据就是个法器。他的作用跟阎王爷的生死簿是一回事,不管来多少人,都能记得下,而且这些人干什么事也都记下来了。还能根据你做的事情发现你现在想要什么哩!

说着我就把我妈的手机要过来了,打开淘宝:

“妈,你是不是想再买一身袄子啊?”我撇了一眼首页问我妈。

“你怎么知道哦?我这袄子穿了两年了,有点破旧了,想换一身。”老妈很惊讶。话说南方还真就这种款式的袄子暖和。

“都在这里,淘宝都告诉我了。”我给她点了点:“你最近做过什么,看过什么,手机后面都有一个大数据法器给你记下来了,然后想办法赚你的钱咧。你这边看完,那边就记下来了,然后给你找更合适的东西让你买。”

我打开拨号画面,输入“ *#06#”,出来了下面这个信息:

老妈眯着眼睛看了半天:“这是什么东西,我都没见过”。

“这就是大数据法器里记录你手机的那个码,就是手机的生辰八字,跟阎王爷生死簿里人名和生辰八字一样的东西。”我点给老妈看着。

“这个法器厉害噢!”二伯拿过手机“这都看不懂啊”!我接过话茬:“这是给大数据法器看的,又不是给你看的。”

我顺手在餐巾纸上写一段SQL:

Select IMEI,user_name,goods_name from Access_Log where IMEI="35413234”

然后指着餐巾纸说:“这就是大数据法器算你之前做过什么的符咒。跟道士画符是一个意思。数据分析师就是写这个符咒给大数据法器,大数据法器就能告诉数据分析师结果了

当过英语老师的大伯拿过餐巾纸,正了正老花镜,远远的拿着仔细观瞧起来:“选择...用户名称、东西名称...从访问记录里,当这个等于这个”,然后撇过头问我:“这个符是不是从访问记录里算到这个手机看过什么东西的吧?

我竖起大拇指:“对啰!还是您老厉害!”


数据分析师刘伯温

我看情势一片大好啊,就继续白活:“各位叔伯,你看那刘伯温,前知五百年,后知五百年,他是怎么做到的”?

一边讲故事的二姐也被吸引过来了,收到“法器”的影响,一下就开窍了:“那刘伯温怕不是带了个手机过去吧?手机里还有一本明朝历史书哦”!

我说:“光有本书还不够,书里有很多细节没有记到。所以还要有一个比手机更厉害的法器才行,要记下前五百年、后五百年的每个人发生的所有事情才可以,最起码也得是重要人物吧。要不怎么能知道这么多事情呢?

二姐咂了砸舌说:“那这个法器得多厉害啊?

我继续说:“这个法器不仅要能装下这么多信息,还要能很快的查出来。刘伯温正在这里打仗呢,想看看敌方哪里有漏洞,摆好法坛,画个符想查一下,结果两天两夜过去了,敌人都打上门了,还没反应,那不完蛋了么!”

五叔毕竟是干过总工程师的:“那不能够!这种设计缺陷早就应该处理好的。”

“对么!”我拍了拍大腿:“所以大数据不仅要能装,还要简单,还要反应快。这样刘伯温想知道什么事情的时候,掐指一算,马上就能知道敌人到哪里了,进一步还能预知敌人要往那边走。这样立刻排兵布阵打他一个措手不及。你看前几年那个下围棋的阿法狗,就是这样赢的,可以预知自己怎么走会赢。”

老妈听到就有些担心了:“那这个法器要多大啊?又要能装,还要快,还要能预知。这个怎么能做到呢?”

我说:“这个其实就很简单了。一个手机其实就是一个小电脑,这就能装很多东西了。大数据技术其实就是把好多个电脑连起来一起存、一起算。你像淘宝,都是几十万台很厉害的电脑连在一起的。有很多工程师在做基础工作,把复杂的事情变简单,以前要摆坛做法,现在只需要掐指一算就可以了。现在很多数据分析师就是在大数据平台的基础上做各种数据分析的工作,增加整个系统的运行效率,让卖货的卖的更快,让买东西的买的更顺心。通过你平时看的东西、买的东西,就能预知你现在大概想买什么,就像我刚才就预知你想买袄子是一个意思。”

一桌人若有所思的点点头。


小外甥的疑惑

这下总算是把“大数据”讲的差不多了。我刚想歇口气,一旁正听的入迷的小外甥冒过头来:“舅舅,那数据分析师是不是就是算命先生啊?”

这一问,问的我一激灵,差点都不知道怎么说话了,只好应付道:“其实他俩都差不多,基本上都是通过现有的一些信息,去推断之后的事情,增加成功的概率。不过数据分析师可能会更准确一些”。话刚说完,我就有些后悔了,因为有些算命先生算的很准,而有些蹩脚数据分析师其实分析的很烂的。

所以,你觉得数据分析师是不是算命先生呢?

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
SQL 安全 大数据
怎么做好大数据安全访问管控?彭文华
怎么做好大数据安全访问管控?彭文华
|
12天前
|
存储 机器学习/深度学习 分布式计算
大数据技术——解锁数据的力量,引领未来趋势
【10月更文挑战第5天】大数据技术——解锁数据的力量,引领未来趋势
|
13天前
|
分布式计算 关系型数据库 MySQL
大数据-88 Spark 集群 案例学习 Spark Scala 案例 SuperWordCount 计算结果数据写入MySQL
大数据-88 Spark 集群 案例学习 Spark Scala 案例 SuperWordCount 计算结果数据写入MySQL
38 3
|
12天前
|
SQL 消息中间件 大数据
大数据-159 Apache Kylin 构建Cube 准备和测试数据(一)
大数据-159 Apache Kylin 构建Cube 准备和测试数据(一)
31 1
|
12天前
|
SQL 大数据 Apache
大数据-159 Apache Kylin 构建Cube 准备和测试数据(二)
大数据-159 Apache Kylin 构建Cube 准备和测试数据(二)
44 1
|
13天前
|
分布式计算 监控 大数据
大数据-148 Apache Kudu 从 Flink 下沉数据到 Kudu
大数据-148 Apache Kudu 从 Flink 下沉数据到 Kudu
39 1
|
14天前
|
消息中间件 缓存 NoSQL
大数据-49 Redis 缓存问题中 穿透、雪崩、击穿、数据不一致、HotKey、BigKey
大数据-49 Redis 缓存问题中 穿透、雪崩、击穿、数据不一致、HotKey、BigKey
33 2
|
6天前
|
NoSQL 大数据 测试技术
想从事大数据方向职场小白看过来, 数据方面的一些英文解释
想从事大数据方向职场小白看过来, 数据方面的一些英文解释
16 0
|
13天前
|
SQL 分布式计算 大数据
大数据-108 Flink 快速应用案例 重回Hello WordCount!方案1批数据 方案2流数据(一)
大数据-108 Flink 快速应用案例 重回Hello WordCount!方案1批数据 方案2流数据(一)
29 0
|
13天前
|
大数据 流计算
大数据-108 Flink 快速应用案例 重回Hello WordCount!方案1批数据 方案2流数据(二)
大数据-108 Flink 快速应用案例 重回Hello WordCount!方案1批数据 方案2流数据(二)
35 0