如何成为数据极客?

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 如何成为数据极客?

今天看到一个词“极客”,这个词真不错(极客时间这个起的名字是真好~)。于是,作为数据人,我思考了什么是“数据极客”?


很多大数据人都是从事过传统BI业务或者数据库业务转型过来的,之前我也写过传统BI如何转大数据数仓。传统BI一般就是写Oracle存储过程,O是真的牛,以前很多银行和电力业务目前还是存储过程写的业务代码。自己曾经亲身经历过,几千行的业务package,写起来和改起来特别有“成就感”!14年的时候听说了Hadoop,网上自己找资料,Win环境搭建跑了起来,现在去百度还能搜到那篇教程文章,后来再也不推荐别人去碰Win搭建Hadoop,只是个玩具!


后来“机缘巧合”,进了一家本地头部公司做大数据,参与主导了大数据从无到有的建设过程。真的很感谢那段晚上十点后回家的岁月,还有工作中的伙伴,这段工作算是自己的一个能力的很大提升。前段时间,一个关注公众号的小伙伴,就是前东家的,还说看到了我写的数据处理代码,直到现在他们还在使用。


所以,数据极客第一个必备的技能就是可以写出“健壮的代码”,不管你是用SQL、Shell、Python还是Java、Scala,能保证你写的代码跑上几年都不会出现效率问题。具体每个数据岗位需求的代码技能不一样,可以参考之前写的这篇文章大数据岗位总结和相关书籍推荐 。


代码写的再溜,可能也只是个工具人儿~所以我还要劝你要精通业务,什么时候可以说精通了呢,要做到业务指标的标准由你说了算,成为领域业务专家,参与一些重要指标的定义,业务流程的制定。最近就遇到了一件事,有个同事被产品经理问到展示客户的数据不对,不该为负数,他只是简单的说,这个数值都是通过某某指定的公式计算出来的,不会有错。其实,再分析这个数据会发现,这个页面展示是需要优化的,针对不同的用户指标的定义是不完全相同的。举个例子,运营商给移动用户发短信开头肯定是,最近的移动用户XXX,而不会是尊敬的联通用户XXX,这个要做到客户无感知,从数据上做适配,那么你不理解这个业务,你怎么知道怎么定义呢。所以,数据人有时候并不是执行者,而是定义者。


做到上面这两点,已经很厉害了,但要成为真正的专家,还要有一些软实力,如沟通能力,在项目的进行过程中,你更需要通过有效的沟通去确定方案,消除误解,与项目成员协同前进;问题解决能力,我见到的数据人,往往能够凭借直觉以最短的时间给出正确的解决方案,但你可能没有看到的是,在这背后其实是经过大量实践累积,加上可以训练而来的经验;计划能力,合理地进行时间分配,并对一些关键任务,进行计划是很重要的,可以在桌面做一个待做、已做的计划列表;管理能力,管理会让人更加睿智并值得他人信赖,所以,当有管理机会到来时,请将它视为机遇和挑战,拥抱它。


数据极客,不能是为了炫技能,进行五花八门的操作,就像小说里的武侠至尊,往往都是手中无剑、心中无我、无我无剑,却能轻松击败对手。所以,我们做数据,要能够实际对业务产生价值,要么能改善重要的指标,要么影响产品决策,要么影响业务流程,要么创造可持续的解决方案,总之,一句话,能够实现“数据驱动”,这样的数据极客才是“正道”!

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
5月前
|
SQL 关系型数据库 MySQL
巅峰极客2023 hellosql
巅峰极客2023 hellosql
56 1
|
缓存 容灾 架构师
极客时间架构实战营总结
极客时间架构实战营总结
397 0
|
存储 机器学习/深度学习 自然语言处理
检索技术核心-极客课程笔记
检索技术核心-极客课程笔记
222 0
检索技术核心-极客课程笔记
|
SQL 算法 计算机视觉
百度飞桨课堂小白逆袭大神第三天课程(整理)
百度飞桨课堂小白逆袭大神第三天课程(整理)
206 0
百度飞桨课堂小白逆袭大神第三天课程(整理)
|
架构师
极客时间架构师训练营笔记2020-09-24
极客时间架构师训练营笔记2020-09-24
140 0
极客时间架构师训练营笔记2020-09-24
|
区块链
【总结】大学四年来,用过的一些网站整理(下)
简介:【总结】大学四年来,用过的一些网站整理(下)
【总结】大学四年来,用过的一些网站整理(下)
【总结】大学四年来,用过的一些网站整理(中)
简介:【总结】大学四年来,用过的一些网站整理(中)
【总结】大学四年来,用过的一些网站整理(中)
|
Java 计算机视觉 Spring
【总结】大学四年来,用过的一些网站整理(上)
简介:1、电脑在大学四年生涯中,刷机一次,由于第一次刷机,备份没有很完全,丢掉了一些用的次数比较少的网站。 2、序号并非排名 3、本文不是任何平台或软件的广告!!!
【总结】大学四年来,用过的一些网站整理(上)
|
监控 前端开发 Cloud Native
第十六届 D2 前端技术论坛完成 6 大专场 21 个话题集结,快来划重点,你一定会有所收获!
一年一度的前端盛会D2前端技术论坛就要来啦,话题集结完成,快来报名学习吧!
1620 0
第十六届 D2 前端技术论坛完成 6 大专场 21 个话题集结,快来划重点,你一定会有所收获!
|
前端开发 中间件 程序员
【资料合集】首届互联网新兵进阶在线峰会:讲义PDF+活动视频!(持续更新)
阿里云云栖社区与云翼计划联合主办了首届互联网新兵进阶在线峰会,两个阿里老人与4位刚进入角色的新兵分别分享了技术人的职业规划与面试和成长经验,我们将本次峰会的讲义PDF+活动视频整理出来,以供大家学习参考。
25169 0