传统金融IT男转型互联网大数据码农,图啥?

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 传统金融IT男转型互联网大数据码农,图啥?

大纲
一、前言

二、自我介绍

三、转折四、学习过程五、找工作

六、总结



一、前言
本篇文章由大数据学习群的同学供稿,他毕业一年,从传统金融IT转型到某大型互联公司做大数据开发,也从C++技术栈变成了大数据技术栈,如今已经入职8个月,也通过这篇文章总结一下他的转型过程。



二、自我介绍


普通本科,软件工程专业,2018 年毕业去了杭州一家金融大厂工作。下面说说我转行之前的公司,我所在的部门是最挣钱的部门--资管,我们的系统覆盖了全部的金融业务,除了保险业务。每天除了完成正常的任务之后,也学了很多金融的业务。工资起点不低,日子过得比较舒服,日常用C++写金融客户端业务代码。


去年年底开始学习大数据,今年3月份入职某大型互联网公司,平时工作主要用Spark和Hive,目前自学Flink中。虽然这份工作经常加班,比之前忙,但比起之前的工作,我还是比较喜欢现在的。



三、转折


虽然金融行业薪水可观,但是限于技术稍微有点老,压力不大,甚至还在使用 delphi。做了一段时间之后,发现不适合自己,由于就有了离职的想法。另一个原因是想换城市。去年(2018年)经济大形势不大好,于是也不敢轻易裸辞。此时的心情是:不甘心就这样下去,先选个适合自己的方向,伺机而动。


选方向的时候,权衡了自己熟悉的 Java 后端开发陌生的大数据开发。自己当时的身份已经不是应届生, 如果选择 Java 后端开发这个已经日益激烈的赛道,当然门槛会更高了。反观大数据开发,市场还很大,更谈不上饱和、竞争激烈这一说,所以我选择了后者大数据开发方向。



四、学习过程


学习时间:上班带薪学习、下班后。
学习资料:a.在网上找的视频(某教育机构的资料)公众号后台回复【资料】,可以获取。b.大数据框架的官方文档。


下面主要说明一下自己的学习历程。


环境准备:
在自己的本地搞了五台虚拟机,开始搭建 Hadoop 集群,版本的话选择的 Hadoop 2.6.5(企业要的比较多的。)中间过程还算比较顺利,也踩了不少坑。搭建文档记录于此:https://www.yuque.com/cuteximi/env/env01



Linux 学习、网站架构学习:


Linux 这一部分过的比较块,主要是找感觉。网站架构学习,我选了一本书,叫做 《大型网站架构》,里面包含了网站架构的演变之路、突破架构瓶颈该如何让做...等等一系列引人思考的案例。


Hadoop 生态:


Hadoop 生态是自己投入时间最多的一部分,打基础比较重要。


HDFS:

  • API 操作
  • 命令行操作
  • 权限管理
  • 原理(文件上传、读取)
  • NameNode HA
  • 架构
  • 文件压缩


Yarn:

  • 架构
  • 任务提交流程
  • 队列


MR2:

  • 架构
  • 任务执行流程


ZK:

  • 架构
  • 应用场景
  • paxos 算法
  • ZK 在 Hadoop 中的作用
  • Znode 操作


Hbase:

  • API操作
  • 架构
  • rowkey
  • 读写流程


Hive 以及数仓基础知识:


  • Hive DML、DDL 操作
  • 数仓建模基础知识
  • Hive 参数调优
  • HiveServer2


Spark 部分


  • Core
  • Spark SQL
  • Streaming
  • MLlib(了解)


我的目标是找工作,所以学习过程比较粗糙。本着先入行的原则,还好思路比较清晰,整个过程没有走偏。


2018年底,整个知识点都学完了。


关于大数据方面的书籍,我看了《离线和实时大数据开发实战》、《数据仓库结构设计与实施》、《Spark技术内幕》、《推荐系统实践》。挑重点部分看的,结合自己学的技术进行消化。



五、找工作



开始面试。


2019年2月份月末来到上海,美化了个人简历,开始投简历。目标不是大厂(想积累一段时间再头大厂),瞄准了中小型互联网公司。


JVM 是必备的功课,深入理解Java虚拟机》 这本书起到了很大的作用。大数据方面,由于学习过程正好跨了一个年,大多都忘得差不多了,还好自己平时学习有记笔记的习惯,所以快速恢复到年前的状态不是问题。笔试题、面试呀看的峰哥整理的笔记。


面试了几家之后(不要学我,面试经验还是太少,不利于后面积累面试经验),成功入职一家大型互联网公司。


面试经历不是很多,除了问一些 JVM、算法等基础的东西,就是聊项目了。至于项目是怎么来的,前面我也提到了看的是培训机构的视频,项目自然也会有。结合大数据技术,映射到之前所工作的项目,足以可以应对面试。



六、工作中


工作内容离线和实时都有涉及。离线的指标都是日活、监控类数据。离线部分使用 Hive 做常规任务,presto 做一些简单的查询工作。实时的主要分为广告类、算法效果类、控量类业务。实时的技术栈还在使用 Spark(虽然 Flink 很火),但是 Spark 的生态更加完善,图计算、机器学习方面更加出色。


最近我也在一直调研 Flink,后面演变实时数仓要用到。不管是什么技术,能解决我们面临的问题就是好技术,门槛也不能太高,要兼顾团队中成员的学习成本。



七、总结


1.三动力:自我激励,自我认知,自我驱动。


2.执行力:记笔记,多总结。
3.面向面试学习虽然比较功利性,但能节约很多时间,效率也较高。


4.不要图眼前的安逸,居安思危。
5.数据一条不能少,这是我做数据开发的底线。


--end--



推荐阅读:五年Java外包转型大数据架构北美零基础转行开发求职面经一位材料专业研究生的Java转型复盘从车辆工程到大数据开发,我经历了什么?从安卓主管转型大数据开发,我经历了什么?两年车间技术员转型大数据开发,说说转型这点事儿

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
7月前
|
存储 JSON 大数据
大数据离线数仓---金融审批数仓
大数据离线数仓---金融审批数仓
592 1
|
7月前
|
SQL 存储 大数据
某互联网大厂亿级大数据服务平台的建设和实践
某互联网大厂亿级大数据服务平台的建设和实践
301 0
|
17天前
|
机器学习/深度学习 人工智能 运维
智能化运维:AI与大数据在IT运维中的应用探索####
本文旨在探讨人工智能(AI)与大数据分析技术如何革新传统IT运维模式,提升运维效率与服务质量。通过具体案例分析,揭示AI算法在故障预测、异常检测及自动化修复等方面的实际应用成效,同时阐述大数据如何助力实现精准运维管理,降低运营成本,提升用户体验。文章还将简要讨论实施智能化运维面临的挑战与未来发展趋势,为IT管理者提供决策参考。 ####
|
1月前
|
机器学习/深度学习 数据采集 搜索推荐
大数据与金融风控:信用评估的新标准
【10月更文挑战第31天】在数字经济时代,大数据成为金融风控的重要资源,特别是在信用评估领域。本文探讨了大数据在金融风控中的应用,包括多维度数据收集、智能数据分析、动态信用评估和个性化风控策略,以及其优势与挑战,并展望了未来的发展趋势。
ly~
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
大数据在智慧金融中的应用
在智能算法交易中,深度学习揭示价格波动的复杂动力学,强化学习依据市场反馈优化策略,助力投资者获取阿尔法收益。智能监管合规利用自然语言处理精准解读法规,实时追踪监管变化,确保机构紧跟政策。大数据分析监控交易,预警潜在违规行为,变被动防御为主动预防。数智化营销通过多维度数据分析,构建细致客户画像,提供个性化产品推荐。智慧客服借助 AI 技术提升服务质量,增强客户满意度。
ly~
155 3
|
5月前
|
NoSQL 大数据 知识图谱
面试题MySQL问题之想使用Neo4j发现隐藏的关系如何解决
面试题MySQL问题之想使用Neo4j发现隐藏的关系如何解决
50 1
|
7月前
|
机器学习/深度学习 人工智能 大数据
AI时代Python金融大数据分析实战:ChatGPT让金融大数据分析插上翅膀
AI时代Python金融大数据分析实战:ChatGPT让金融大数据分析插上翅膀
340 6
|
7月前
|
运维 Cloud Native 安全
【专栏】随着信息技术发展,运维正向自动化、智能化转型,云原生运维成为主流,大数据驱动运维决策,而安全运维日益重要
【4月更文挑战第29天】随着信息技术发展,运维正向自动化、智能化转型,云原生运维成为主流,大数据驱动运维决策,而安全运维日益重要。面对技术更新快、人才短缺和复杂性增加的挑战,企业需建立培训体系,加强人才培养,优化运维管理,以适应未来运维需求。随着这些趋势,运维领域将迎来更广阔的发展前景。
211 2
|
7月前
|
存储 关系型数据库 测试技术
印尼医疗龙头企业Halodoc的数据平台转型之Lakehouse架构
印尼医疗龙头企业Halodoc的数据平台转型之Lakehouse架构
88 4
|
7月前
|
监控 搜索推荐 大数据
大数据在金融领域的应用有哪些?请举例说明。
大数据在金融领域的应用有哪些?请举例说明。
130 0
下一篇
DataWorks