校招季|OceanBase主架构师杨传辉:数据库行业即将进入井喷期,现在加入恰逢其时

本文涉及的产品
云原生数据库 PolarDB PostgreSQL 版,标准版 2核4GB 50GB
云原生数据库 PolarDB MySQL 版,通用型 2核4GB 50GB
简介: 又到一年就业季,大学里的莘莘学子即将走出象牙塔,面临人生的重大抉择。今年由于疫情,全球经济面临挑战,很多行业受到影响,同学们在选择人生中第一份工作的时候,也应该更加慎重。我们正在迈入数据智能时代,数据库作为数据智能时代的底层基础设施,在新的环境下焕发出新活力。数据库行业前景如何,想要进入数据库行业需要具备什么条件,我们邀请了蚂蚁金服研究员兼OceanBase主架构师杨传辉老师,来谈谈他的看法。

又到一年就业季,大学里的莘莘学子即将走出象牙塔,面临人生的重大抉择。今年由于疫情,全球经济面临挑战,很多行业受到影响,同学们在选择人生中第一份工作的时候,也应该更加慎重。

我们正在迈入数据智能时代,数据库作为数据智能时代的底层基础设施,在新的环境下焕发出新活力。数据库行业前景如何,想要进入数据库行业需要具备什么条件,我们邀请了蚂蚁金服研究员兼OceanBase主架构师杨传辉老师,来谈谈他的看法。

国内数据库行业正处在千载难逢的机遇期

数据库行业发展到今天已有40多年历史,相对于互联网来说,算是一门古老的学科。进入二十一世纪之后,随着互联网和云计算的发展,数据库行业也焕发了新的活力。

这十几年来数据库的发展,可以简要的总结为多样化和云化,对于国内的数据库发展,还可以加上一个国产化。

在互联网诞生以前,以Oracle为代表的传统数据库足以应对绝大多数数据管理的需求。但进入互联网时代以后,面对时刻增长的海量数据、同时在线的海量用户,传统数据库开始力不从心了。

为了应对这些挑战,以Google BigTable和HBase为代表的分布式列式数据库诞生了,它们是非关系型数据库,为了与之前的关系数据库相区别,又把它们叫做NoSQL。不过,NoSQL并不是只包含这一种数据库,而是所有非关系型数据库都包含在内。

2010年左右,以MongoDB为代表的NoSQL迅速发展壮大,并很快引领了数据库领域变革的潮流,各种用途、类型的数据库如雨后春笋般出现,如时序数据库、图数据库等,不再有一个数据库包打天下,不同的数据库服务于不同场景,这就是多样化的含义。

其次是云化,云化的内涵是要让数据库变得和电和水一样,随取随用,这对数据库的灵活性和可扩展性提出了极高要求。分布式数据库天然支持水平扩展,传统关系型数据库则难以和云一样进行扩展。但是,企业在管理重要数据时,为了数据一致性,仍然需要关系数据库。
image.png

从上图可以看到,虽然非关系型数据库火过一段时间,但关系数据库还是今天整个企业数据管理平台的主流。所以,未来的数据库也必然是关系数据库,同时具备分布式的特征。将关系数据库和分布式结合成为大势所趋,这种新型数据库也被称为云数据库或者NewSQL。

同时具备分布式和关系数据库特点的代表之一就是OceanBase,从2017年起,OceanBase承担了支付宝所有核心业务的数据,并支撑多年双11超高峰值。2019年10月,OceanBase登顶TPC-C排行榜,打破了该测试保持近10年的记录,也证明了分布式关系数据库这条技术路线的正确性。

最后再说说国产化。近几年由于众多原因,国内对核心技术自主可控的要求十分迫切,数据库作为计算机软件系统的核心技术,在很长一段时间内都由国外厂商把持。国内早年也曾经有一些厂商进行了国产化的努力,但是,这些国产数据库大多数是对Oracle数据库的模仿,在功能、性能等条件上要差一些,无法对国外数据库造成威胁。

但是,随着互联网发展,传统关系数据库不支持高并发、难扩展的特点暴露出来,也就给国内数据库提供了机会。新一代的国产数据库,将会在互联网诞生,经历互联网海量数据和用户的验证,并对传统数据库形成冲击。近年来,国内互联网公司在数据库领域大举投入,并各自推出了自己的数据库,下一代数据库王者,将在这些数据库当中诞生,并对传统数据库形成降维攻击。

所以说,多种因素叠加在一起,国内数据库领域正面临千载难逢的机遇期,对于应届生来说,数据库领域前景广阔,人才缺口也很大。

数据库行业需要什么样的人才

对于数据库行业需要的人才,杨传辉老师将他们分为两类:产品型和研究型。

产品型是指研发数据库应用和产品的人才。前面提到了数据库的多样化趋势,一家公司想要开展互联网业务,需要的是多个、多种数据库一起提供支撑,因此我们需要熟悉各种数据库并对其进行定制和优化,为业务提供服务。

研究型指的是在技术层面钻的很深的专业人才。这个很好理解,数据库是一种底层软件,这个领域可以在技术上做到非常深,这个行业诞生过三个图灵奖,也是一个明证。而在上面云化和国产化的趋势下,我们需要大量对数据库理解透彻并能够做出技术创新的人才。

对于高校学生来说,从学术研究转到数据库底层研发是很自然的,在职业生涯早期,能够在工业界做出成果,对个人成长也是非常有利的。

对于产品型人才,大多数需要有一定经验积累,对行业非常了解,对业界主流技术架构和数据库特点做到了然于胸,根据场景下使用对应的数据库。对于应届生来说,一般需要在不同岗位多锻炼几年,才能独当一面。

而无论是产品型还是研究型,都属于研发人员,对于刚出校门的应届生,需要具备一些基本素质。

首先,技术基础很重要,对于大学里学习的课程,如数据结构、算法、操作系统等,需要好好掌握,这些技术基础也将在之后的职业生涯里提供非常大的帮助。

其次,数据库是一个偏工程实践的行业,因此会重视候选人的动手实践能力,无论是在导师手下做项目,还是在公司的实习经历,都会给面试加分,也会让你提前了解到数据库研发是一个什么样的职业。

最后,对于搞研发的人员来说,还有一些素质决定他们未来成长的潜力或者高度,包括好奇心、学习的主动性等。只有对技术充满热情和好奇心,并且能够克服懒惰和枯燥学习未知的技术,才能在研发这条路上走下去。

OceanBase团队是如何培养应届生的

OceanBase数据库在对外开放以来,吸引了众多外部客户,已经服务的包括建设银行、南京银行、中国人保健康、西安银行等。研发需求量大增,对于人才的缺口很大,在今年的校招中,也希望能招募到优秀的应届生人才。
image.png

杨老师介绍,成功入职OceanBase团队的应届生,会根据个人的特点,分配到不同的开发小组,负责从产品模块到数据库内核的研发。

对于应届生的成长,团队也提供了全面的培养。

首先是蚂蚁的“师兄文化”,会为每一位新人配上师兄,通过师兄的传帮带,帮助新人找到自己的位置和价值,跨越专业技能和方法方面的障碍,更好的融入整个公司的文化氛围,提升技术实力。

其次是技术分享和培训。OceanBase团队的技术分享和别人不同的地方在于,别的团队是老人分享新人听,而OceanBase团队是新人分享大家听,无论是阅读论文还是理解一套系统,新人都需要在团队内部进行分享,而团队成员会给他反馈,通过这样的过程不断提升。这种方式也叫做“费曼学习法”,只有理解透彻才好和别人讲,输出是为了更好的学习。

更多的培养是在工作中培养,通过有挑战性的工作,新人才会得到有体感的知识,而不是别人灌输的。在这个过程中,师兄和团队成员也会及时给予指导和帮助,让工作和学习能够很好的结合在一起。

对应届生的建议

对于计算机和软件相关学科的应届生来说,在考虑未来道路时难免迷茫,有些人在选择行业时会优先考虑那些媒体反复炒作的热门行业。

但是,有些东西流行起来很快,衰落起来也很快,一旦入错行,想要换方向也不是那么简单的。

杨老师建议,对于应届生来说,与其东一榔头西一棒子的去追时髦,追热点,不如沉下心来,从基础方向做起,比如数据库、操作系统等。等在这些基础技术领域做到一定深度后,再去学习其它领域,可以做到举一反三、事半功倍。等到有了技术深度,同时又具备广阔的视野和眼界,也就是企业所推崇的T型人才,这样的人才无论是在哪里都是很受欢迎的。而想要成为这样的人才,最好就是从基础技术领域起步。

数据库一直以来是计算机软件领域的常青树,懂数据库的人才在各个企业都很吃香,而当前数据库领域面临机遇期,人才缺口很大,但是社会和媒体上对这点认知还不够,这就像和那些“隐形冠军”一样,少为人知,但行业稳定,待遇优秀,并且在整个软件行业的地位十分关键,是高校学生们就业的好选择。

对于想要从事数据库行业的应届生们,杨老师则建议多多积累动手实践经验,无论是在导师下做项目,还是在企业实习,甚至是个人的私人项目,也都会成为面试时的加分项。

OceanBase团队应届生招聘正在火热进行中,欢迎同学们加入,与OceanBase一起创造下一个奇迹!

OceanBase开发工程师(Java/C++)

工作地点:杭州/北京/上海
职位要求:
 计算机,数学,统计学, 运筹学或相关专业应届毕业生;
 良好的计算机专业基础,熟练掌握数据结构、算法、操作系统等基础知识;
 优秀的编程能力,熟练使用C/C++或者Java编程语言;
 良好的团队协作能力,有技术激情,能够胜任有挑战的工作;
 有分布式系统、数据库或者其它底层系统研发经验优先;
想要加入我们,你可以:
直接发送简历到OceanBase-Public@list.alibaba-inc.com,我们等的就是你!

相关实践学习
使用PolarDB和ECS搭建门户网站
本场景主要介绍基于PolarDB和ECS实现搭建门户网站。
阿里云数据库产品家族及特性
阿里云智能数据库产品团队一直致力于不断健全产品体系,提升产品性能,打磨产品功能,从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手,打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系, 结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台,为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案,提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。
目录
相关文章
|
4月前
|
NoSQL 关系型数据库 MySQL
微服务架构下的数据库选择:MySQL、PostgreSQL 还是 NoSQL?
在微服务架构中,数据库的选择至关重要。不同类型的数据库适用于不同的需求和场景。在本文章中,我们将深入探讨传统的关系型数据库(如 MySQL 和 PostgreSQL)与现代 NoSQL 数据库的优劣势,并分析在微服务架构下的最佳实践。
|
4月前
|
设计模式 缓存 关系型数据库
探索微服务架构中的数据库设计挑战
微服务架构因其模块化和高扩展性被广泛应用于现代软件开发。然而,这种架构模式也带来了数据库设计上的独特挑战。本文探讨了在微服务架构中实现数据库设计时面临的问题,如数据一致性、服务间的数据共享和分布式事务处理。通过分析实际案例和提出解决方案,旨在为开发人员提供有效的数据库设计策略,以应对微服务架构下的复杂性。
|
4月前
|
消息中间件 缓存 监控
优化微服务架构中的数据库访问:策略与最佳实践
在微服务架构中,数据库访问的效率直接影响到系统的性能和可扩展性。本文探讨了优化微服务架构中数据库访问的策略与最佳实践,包括数据分片、缓存策略、异步处理和服务间通信优化。通过具体的技术方案和实例分析,提供了一系列实用的建议,以帮助开发团队提升微服务系统的响应速度和稳定性。
|
5月前
|
存储 SQL 分布式数据库
OceanBase 入门:分布式数据库的基础概念
【8月更文第31天】在当今的大数据时代,随着业务规模的不断扩大,传统的单机数据库已经难以满足高并发、大数据量的应用需求。分布式数据库应运而生,成为解决这一问题的有效方案之一。本文将介绍一款由阿里巴巴集团自主研发的分布式数据库——OceanBase,并通过一些基础概念和实际代码示例来帮助读者理解其工作原理。
447 0
|
2月前
|
存储 SQL Apache
Apache Doris 开源最顶级基于MPP架构的高性能实时分析数据库
Apache Doris 是一个基于 MPP 架构的高性能实时分析数据库,以其极高的速度和易用性著称。它支持高并发点查询和复杂分析场景,适用于报表分析、即席查询、数据仓库和数据湖查询加速等。最新发布的 2.0.2 版本在性能、稳定性和多租户支持方面有显著提升。社区活跃,已广泛应用于电商、广告、用户行为分析等领域。
Apache Doris 开源最顶级基于MPP架构的高性能实时分析数据库
|
2月前
|
缓存 关系型数据库 MySQL
高并发架构系列:数据库主从同步的 3 种方案
本文详解高并发场景下数据库主从同步的三种解决方案:数据主从同步、数据库半同步复制、数据库中间件同步和缓存记录写key同步,旨在帮助解决数据一致性问题。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
高并发架构系列:数据库主从同步的 3 种方案
|
2月前
|
存储 NoSQL 分布式数据库
微服务架构下的数据库设计与优化策略####
本文深入探讨了在微服务架构下,如何进行高效的数据库设计与优化,以确保系统的可扩展性、低延迟与高并发处理能力。不同于传统单一数据库模式,微服务架构要求更细粒度的服务划分,这对数据库设计提出了新的挑战。本文将从数据库分片、复制、事务管理及性能调优等方面阐述最佳实践,旨在为开发者提供一套系统性的解决方案框架。 ####
|
2月前
|
消息中间件 数据库 云计算
微服务架构下的数据库事务管理策略####
在微服务架构中,传统的单体应用被拆分为多个独立的服务单元,每个服务维护自己的数据库实例。这种设计提高了系统的可扩展性和灵活性,但同时也带来了分布式环境下事务管理的复杂性。本文探讨了微服务架构下数据库事务的挑战,并深入分析了几种主流的事务管理策略,包括Saga模式、两阶段提交(2PC)以及基于消息的最终一致性方案,旨在为开发者提供一套适应不同业务场景的事务处理框架。 ####
|
2月前
|
设计模式 存储 缓存
微服务架构下的数据库设计策略
本文探讨了在微服务架构中进行数据库设计时,如何平衡数据的一致性、独立性与系统整体性能之间的关系。文章首先介绍了微服务架构的基本概念及其对数据库设计的影响,随后深入分析了三种主流的数据库设计模式——集中式、去中心化和混合模式,并结合实际案例讨论了它们的适用场景与优缺点。此外,还提出了一系列最佳实践建议,旨在帮助开发者更好地应对微服务环境下的数据管理挑战。
|
4月前
|
消息中间件 缓存 监控
优化微服务架构中的数据库访问:策略与实践
随着微服务架构的普及,如何高效管理和优化数据库访问成为了关键挑战。本文探讨了在微服务环境中优化数据库访问的策略,包括数据库分片、缓存机制、异步处理等技术手段。通过深入分析实际案例和最佳实践,本文旨在为开发者提供实际可行的解决方案,以提升系统性能和可扩展性。