数据人上班划水都聊什么

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 数据人上班划水都聊什么

今天上午数仓专业群里讨论的格外火热,中午 11 点得空看了一下几百条消息,想了下,一定是发生了有趣的讨论,现在一哥就带你一起回顾下~ 看完了群里的几百条消息,总结了下,大家讨论主要围绕以下几个方向:


  • 1,你们的大数据平时主要做什么工作?
  • 2,大数据的未来是什么?
  • 3,数据治理怎么做?
  • 4,35 岁了该怎么转型?


下面我们一一来看大家都对上面的问题怎么看的。

大数据工作平时主要干啥

写 SQL

搞 etl,头三年写 sql,再三年当个组长教人写 sql,再三年基本上就是基本上就是专家了,还写个毛 sql,把文档规范写写,没什么事,开开会,不香么?


一位群友说现在做的就是离线处理工作,天天就是 Hive SQL,对接各种需求,提个数,现在已经沦为 SQL boy!看着做实时计算的同事都是在写 Scala,确实现在实时计算已经很流行了,但是我很统一另外一位群友的观点:做实时计算就不用写 SQL 了?不错,可以看看现在哪个大数据计算引擎敢不支持 SQL,看看 Flink,另外看看现在主导这些开源项目的领导者很多都是以前搞关系型数据库出来的。所以,写 SQL 没什么不好,但是不能只会 SQL,可以看看之前一哥写过一篇文章《数仓工程师如何避免沦为“提数机”》,就算跳槽了,将来也好有筹码谈薪不是。

建模

没有做过咨询,搞起来的模型,理论上都没有验证梳理过。


很多人会说,我不是写 SQL 的,我是建模工程师。“建模,都是靠咨询出来的”,可以看到建模并不是一个技术性很强的工作,而是一个业务强相关的。不深入业务,那么你的模型是很难有立足之地的。可以看看之前一哥写的一篇文章《业务重要?还是技术重要?》。

撸代码(Java、Scala)

幸亏 我尼玛三年前 java 转产品了。


一位群友说之前是 java 转的数据库开发,当时是感觉写 java,还要写前台,中间件,还要写那么一堆框架……所以转了 etl。其实,搞数据和 Java,目的是一样的,怎么把业务问题解决,看你自己怎么选。有些群友是干着 Java,慢慢还得干前端开发,自己就放弃了……,自己现在有个朋友就是这种情况,不知道大家处理转方向,都是怎么处理的,可以评论区留言告诉我下~

大数据的未来是什么

算法挖掘

AI 工作者跟精神病院护工的工作性质比较类似,大量行为靠猜!


大数据的用途就是在于计算存储数据,但是不结合算法很难发挥大的价值。一位群友说,现在大数据做的好的都在慢慢往算法上靠,我很赞同,自己也有相同的经历。


其实,很明显的感觉到,现在说大数据都要挂上 AI,那么什么是 AI?“人工+智能,有多智能,就有多少人工~”。另外,很多人工智能算法部署需要硬件的支持,但是现在很多企业在用的硬件并不支持,如果要使用 AI,也许就要对所有的设备更新换代,这也是 AI 现在很难落地的原因。老板们都想着把十几万的大众,搞成自动驾驶……


那么做算法挖掘看起来现在还更靠谱一些,做算法必须要学习一些统计学知识了,可能需要你徒手写公式了,要不然,别人问你分析的结果怎么出来的,你只能说是算法自己跑出来的,这就尴尬了。

clickhouse

群里有一位大佬,就说 clickhouse 是未来的方向,赶紧学吧!为什么呢?


clikhouse 给人的第一感觉就是“快”,天下武功,唯快不破。这同时说明了,现在数据分析、业务人员大家都喜欢快的产品,MR 你再强,我也认不了坐那等一个小时出结果。所以,大数据的未来一个方向就是查询要快。硬件资源 CPU 有大的技术更新很难,所以实时计算,也必然大方向了。可以看看之前分享的一些 clickhouse 的文章:《趣头条ClickHouse实战.ppt》《Hbase、Kudu和ClickHouse全视角对比

数据治理怎么做

实际上数据治理从实施路径上看,有了高层支持和前期规划后,接下来就是依赖工具去执行,所以工具的智能和操作重复这块就需要多考虑,总之就是让实际元数据、数据标准、数据质量小组人员操作简便。元数据与标准贴合是比较高的,标准与数据质量贴合也很高,所以必须让三个模块互融互通较少录入工作量,让系统自动抽取,智能推荐才是王道。


大数据平台数据治理与建设方案(附84页PPT)》《数据治理的挑战和最佳实践(附PPT)

35 岁了该怎么转型

技术能力不能丢

PPT 是最好的语言!


其实写文字和写代码一样,都是一种技术能力。而且牛 B 的技术就能把技术讲的普通人都能懂。不管是做管理,或者是做咨询,建议技术能力都要抓一下,可以参考之前写的一篇文章《【一哥闲聊】程序员如何打破35岁魔咒

转型(离职)?

好几个群友都说 35 岁后就很难找工作了,而且做数据开发离职,牵扯了很多业务,不好走。其实,我很赞同另外一个群友的观点:钱到位了就留下,不到位就走,一个离职说的都快拍一个电影了都~


花了一个小时,把大家的聊天记录看了好几遍,花了一个小时总结上面的一些内容,也是第一次发这样的文章,有群里的读者看到整理的不对,欢迎在评论区留言更正~

目录
相关文章
|
编译器 程序员 C语言
重生之我要学C++第二天
重生之我要学C++第二天
100 0
|
大数据 测试技术 程序员
【面试邀请】温大大和他的朋友们,日常都是怎么「摸鱼+加薪」的?
大家好,我是温大大 就像马丁·路德·金说过一句话:I have a dream 温大大也有个梦想就是: 1、将毕生所学的「测试技能」倾囊相授传给各位同学,让同学们升职加薪。 2、组建一个测试圈,在这里我们可以:讨论「测试」技术问题、揭秘「测试」薪酬、分享「面试」套路。
【面试邀请】温大大和他的朋友们,日常都是怎么「摸鱼+加薪」的?
|
敏捷开发 人工智能 安全
周末来个王炸!!
为了让学习更有趣,这篇文章我会列出计算机科学理论和一些概念,并且用类比的方式和尽量少的技术术语来为你进行解释。这样做的目的就是为了让你快速了解计算机,查漏补缺。
周末来个王炸!!
|
机器学习/深度学习 人工智能 程序员
上班要怎么摸鱼才不会被老板发现?
上班要怎么摸鱼才不会被老板发现?
411 0
上班要怎么摸鱼才不会被老板发现?
|
算法 安全 Java
周末去面试,进去 5 分钟就出来了…
你们可能会想,栈长这么菜的吗?5分钟都坚持不了? 本文说起来会有点尴尬,毕竟这是栈长我曾经经历过的故事。。。
周末去面试,进去 5 分钟就出来了…
面试入职工作感悟:在阿里的那些风花雪月的日子
为什么来阿里?听说阿里钱多,所以我就来了; 听说阿里企业文化很好,所以我就来了;看到马云这么帅,所以我就来了; 接到猎头电话,所以我就来了; 我也不知道,糊哩糊涂的我就来了。
6132 0
|
Web App开发 程序员
亲爱的老板:程序员的10分钟就是3个小时
导读:国外程序员艾德·韦斯曼(Ed Weissman )从业32年。某天老板告诉他产品有个问题,10分钟可以修复问题,谁知结果一干就是3个小时。本文就是艾德记录下的过程。 10:48 老板:嗨,艾德,苏在底特律说,“产品历史屏幕”上经常出现错误的发票号码(Invoice Part Number)。
921 0
|
Java 程序员 C++
应聘腾讯,面试官和我聊了一个小时的人生
文章来源【程序员江湖】 作者黄小斜,斜杠青年,某985硕士,阿里研发工程师,于2018 年秋招拿到 BAT 头条、网易、滴滴等 8 个大厂 offer 个人擅长领域 :自学编程、技术校园招聘、软件工程考研 作为一名深受腾讯游戏“毒害”的90后,以前最大的理想就是到腾讯开发游戏,去看看腾讯游戏的葫芦里到底卖的是什么药,才会让这么多祖国花朵甘愿把时间和金钱都投入到他们研发的游戏中。
|
新零售 程序员 区块链
干了这碗鸡汤:从理发店小弟到阿里P10技术大牛
1、引言 MIT TR 35(MIT Technology Review 35 Innovators Under 35)——“全球 35 位 35 岁以下科技创新青年”榜单,是全球最权威的青年科技创新人才榜单之一。
2732 0

相关实验场景

更多