怎么给大爷讲清楚“什么是大数据”?彭文华

简介: 怎么给大爷讲清楚“什么是大数据”?彭文华

这是彭文华的第131篇原创

前几天老家有事,不得已回去了一趟。疫情影响,一路都是严防死守,到家也一直戴着口罩,一刻也不能松懈。

在家少不了话话家常,话题正好聊到我公众号上。我大伯就问了个问题:“文华,你给我讲讲这大数据到底是个什么玩意啊?”我这顿时就愣住了,大脑开始疯狂的思考,半晌没搭话。这帮大爷一点技术基础都没有,各种概念都没接触过,这咋说啊?我总不可能从大数据的4个V开始说吧?




用场景解释

五叔看我有些尴尬,赶忙来打圆场:“这大数据可是很高深的东西,怕是一两句话说不清楚啊”。

五叔退休前是矿场的总工程师,这是个好切入口,大数据在矿场也是有应用场景的。

我整理了一下思路:“五叔你在矿上,开采前得到处探矿,开采时得安全生产。以前的信息都是一点点探出来的,安全生产也是靠人盯着,有点信息就记到本本上。如果有一个非常厉害的东西可以自动搜集各种数据,然后加以利用,这就是大数据了

我比划了一下坑道:“比如我们可以在坑道里放置瓦斯探测器、压力传感器各种探测器,实时收集坑道里的瓦斯浓度、压力传感器等信息,然后监控起来,1秒甚至10微秒一计算,一旦数值超过阈值,报警信息立刻通过各种各样的方式传播出去。这些数据也会留下来,以后可以进行进一步分析。因此大数据会涉及到各种各样的新技术,让系统可以存储特别特别多的数据,让报警特别快的反应,发现数据中更多更有价值的信息。你看,我这么说,大数据的4个V都体现了。

五叔说:“我们之前也用其他方式实现过坑道的预警,而且在地下的信号传输不太方便,不过我大致已经知道是这么回事了。可是其他叔叔伯伯估计还是不太懂啊

我蒙圈了,也是哦。这咋整?


大数据是个法器

大伯是英语老师,二伯是建筑工人,职业都不一样啊,我总不可能挨个说一遍各自行业的应用场景吧。我又开始发呆了。正巧旁边神叨叨的二姐正在给小外甥讲故事:“这孙悟空跑地府去,把阎罗王揍了一顿,找到生死簿,把猴子猴孙那几页全给撕掉了....”。嘿,我这灵感就来了~~

我说:“我们中国现在14亿人口,阎王爷的生死簿得多厚啊?要擒一个人怎么办?还有,那么多一样名字的嘞,擒错了怎么办?

我妈是个资深佛教徒,赶忙摆摆手:“阎王爷的生死簿那是个法器,多少人都能装进去。擒人的时候还要加上生辰八字和地址咧!”

我说:“对啰!大数据就是个法器。他的作用跟阎王爷的生死簿是一回事,不管来多少人,都能记得下,而且这些人干什么事也都记下来了。还能根据你做的事情发现你现在想要什么哩!

说着我就把我妈的手机要过来了,打开淘宝:

“妈,你是不是想再买一身袄子啊?”我撇了一眼首页问我妈。

“你怎么知道哦?我这袄子穿了两年了,有点破旧了,想换一身。”老妈很惊讶。话说南方还真就这种款式的袄子暖和。

“都在这里,淘宝都告诉我了。”我给她点了点:“你最近做过什么,看过什么,手机后面都有一个大数据法器给你记下来了,然后想办法赚你的钱咧。你这边看完,那边就记下来了,然后给你找更合适的东西让你买。”

我打开拨号画面,输入“ *#06#”,出来了下面这个信息:

老妈眯着眼睛看了半天:“这是什么东西,我都没见过”。

“这就是大数据法器里记录你手机的那个码,就是手机的生辰八字,跟阎王爷生死簿里人名和生辰八字一样的东西。”我点给老妈看着。

“这个法器厉害噢!”二伯拿过手机“这都看不懂啊”!我接过话茬:“这是给大数据法器看的,又不是给你看的。”

我顺手在餐巾纸上写一段SQL:

Select IMEI,user_name,goods_name from Access_Log where IMEI="35413234”

然后指着餐巾纸说:“这就是大数据法器算你之前做过什么的符咒。跟道士画符是一个意思。数据分析师就是写这个符咒给大数据法器,大数据法器就能告诉数据分析师结果了

当过英语老师的大伯拿过餐巾纸,正了正老花镜,远远的拿着仔细观瞧起来:“选择...用户名称、东西名称...从访问记录里,当这个等于这个”,然后撇过头问我:“这个符是不是从访问记录里算到这个手机看过什么东西的吧?

我竖起大拇指:“对啰!还是您老厉害!”


数据分析师刘伯温

我看情势一片大好啊,就继续白活:“各位叔伯,你看那刘伯温,前知五百年,后知五百年,他是怎么做到的”?

一边讲故事的二姐也被吸引过来了,收到“法器”的影响,一下就开窍了:“那刘伯温怕不是带了个手机过去吧?手机里还有一本明朝历史书哦”!

我说:“光有本书还不够,书里有很多细节没有记到。所以还要有一个比手机更厉害的法器才行,要记下前五百年、后五百年的每个人发生的所有事情才可以,最起码也得是重要人物吧。要不怎么能知道这么多事情呢?

二姐咂了砸舌说:“那这个法器得多厉害啊?

我继续说:“这个法器不仅要能装下这么多信息,还要能很快的查出来。刘伯温正在这里打仗呢,想看看敌方哪里有漏洞,摆好法坛,画个符想查一下,结果两天两夜过去了,敌人都打上门了,还没反应,那不完蛋了么!”

五叔毕竟是干过总工程师的:“那不能够!这种设计缺陷早就应该处理好的。”

“对么!”我拍了拍大腿:“所以大数据不仅要能装,还要简单,还要反应快。这样刘伯温想知道什么事情的时候,掐指一算,马上就能知道敌人到哪里了,进一步还能预知敌人要往那边走。这样立刻排兵布阵打他一个措手不及。你看前几年那个下围棋的阿法狗,就是这样赢的,可以预知自己怎么走会赢。”

老妈听到就有些担心了:“那这个法器要多大啊?又要能装,还要快,还要能预知。这个怎么能做到呢?”

我说:“这个其实就很简单了。一个手机其实就是一个小电脑,这就能装很多东西了。大数据技术其实就是把好多个电脑连起来一起存、一起算。你像淘宝,都是几十万台很厉害的电脑连在一起的。有很多工程师在做基础工作,把复杂的事情变简单,以前要摆坛做法,现在只需要掐指一算就可以了。现在很多数据分析师就是在大数据平台的基础上做各种数据分析的工作,增加整个系统的运行效率,让卖货的卖的更快,让买东西的买的更顺心。通过你平时看的东西、买的东西,就能预知你现在大概想买什么,就像我刚才就预知你想买袄子是一个意思。”

一桌人若有所思的点点头。


小外甥的疑惑

这下总算是把“大数据”讲的差不多了。我刚想歇口气,一旁正听的入迷的小外甥冒过头来:“舅舅,那数据分析师是不是就是算命先生啊?”

这一问,问的我一激灵,差点都不知道怎么说话了,只好应付道:“其实他俩都差不多,基本上都是通过现有的一些信息,去推断之后的事情,增加成功的概率。不过数据分析师可能会更准确一些”。话刚说完,我就有些后悔了,因为有些算命先生算的很准,而有些蹩脚数据分析师其实分析的很烂的。

所以,你觉得数据分析师是不是算命先生呢?

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
8月前
|
SQL 安全 大数据
怎么做好大数据安全访问管控?彭文华
怎么做好大数据安全访问管控?彭文华
|
19天前
|
数据采集 SQL 数据可视化
大数据可视化技巧:借助PowerBI提升数据故事讲述力
【4月更文挑战第8天】Power BI助力大数据可视化,支持多种数据源连接,如SQL Server、Excel,提供数据清洗与转换功能。通过选择合适图表类型、运用颜色和大小强化表达,创建交互式仪表板。讲述数据故事时,注重故事主线设计,利用叙事技巧引导观众,并添加文本说明。分享已完成报告,提升数据驱动决策能力。动手实践,体验Power BI的强大与易用。
35 0
|
2月前
|
分布式计算 DataWorks IDE
MaxCompute数据问题之忽略脏数据如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
48 0
|
2月前
|
SQL 存储 分布式计算
MaxCompute问题之下载数据如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
40 0
|
2月前
|
分布式计算 关系型数据库 MySQL
MaxCompute问题之数据归属分区如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
38 0
|
2月前
|
分布式计算 Cloud Native MaxCompute
MaxCompute数据问题之没有访问权限如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
40 0
|
1天前
|
SQL 分布式计算 大数据
MaxCompute产品使用合集之怎样可以将大数据计算MaxCompute表的数据可以导出为本地文件
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
1天前
|
存储 分布式计算 大数据
MaxCompute产品使用合集之大数据计算MaxCompute中需要存储16进制的数据,我该怎么操作
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
1天前
|
存储 分布式计算 大数据
MaxCompute操作报错合集之大数据计算MaxCompute将数据存储为字符串后,在查询时发现数据变成了乱码而不是16进制,如何解决
MaxCompute是阿里云提供的大规模离线数据处理服务,用于大数据分析、挖掘和报表生成等场景。在使用MaxCompute进行数据处理时,可能会遇到各种操作报错。以下是一些常见的MaxCompute操作报错及其可能的原因与解决措施的合集。
|
1天前
|
SQL 分布式计算 DataWorks
MaxCompute操作报错合集之在大数据计算MaxCompute中,原表里面有数据不能删,用alter table报错DDL is not enabled,怎么修改字段类型
MaxCompute是阿里云提供的大规模离线数据处理服务,用于大数据分析、挖掘和报表生成等场景。在使用MaxCompute进行数据处理时,可能会遇到各种操作报错。以下是一些常见的MaxCompute操作报错及其可能的原因与解决措施的合集。

热门文章

最新文章