阿里云数据库掌门人褚霸:骑行与数据人生

本文涉及的产品
云原生数据库 PolarDB MySQL 版,Serverless 5000PCU 100GB
云原生数据库 PolarDB PostgreSQL 版,企业版 4核16GB
推荐场景:
HTAP混合负载
云原生数据库 PolarDB MySQL 版,通用型 2核4GB 50GB
简介: 本文主要从霸爷的骑行经历开始聊起,进而联系到数据库经历,从初识数据库谈及到云下转入云上,最后重点与大家分享了POLARDB 数据库。

本文主要从霸爷的骑行经历开始聊起,进而联系到数据库经历,从初识数据库谈及到云下转入云上,最后重点与大家分享了POLARDB 数据库。

 


今天的电梯访谈我们请来了褚霸和我们聊聊他的骑行与数据库人生。

1705ce2d5c22c87aa7a1a35a06dadae7368edf24

以下是精彩内容整理:

骑行有很多乐趣,骑行给我无拘无束的感觉,骑行是一种激情,让我兴奋,享受着超越感。而数据库与骑行对我来说是相通的,坚持去做的事情一定是你有兴趣的事情,没有激情是很难做到极致,数据库与骑行一样,没有上限,投入精力越多,探索深度越深。

初识数据库

“我的梦想是做一个最牛X的数据库!”,尽管这是一句戏言,但也表露出我对数据库的热爱和野心。误打误撞或是机缘巧合,我从高性能服务器转做数据库,从最基础的MySQL代码开始学起,随着经验的积累,不断成长为如今的云数据库掌门人。

从仰望Orcale到现在和它做同样的事情,阿里云数据库实现了质的飞跃,阿里团队付出了很多。我们抓住了几个重要的机遇,比如历史的变革,2010年SSD出现,给我们很好的机会,在此场景下,原来系统不太适合,淘宝抓住了机会,淘宝的核心数据库都在这些硬件上跑,所以我们有很多场景,很多锤炼,双十一规模超大,每年都是七倍往上翻。

现在数据库团队的骨干都是和当年的我差不多资历的人,对于他们的执着我特别感动,因为许多事情看起来的确很枯燥,很佩服他们的工匠精神。我从他们身上学到了很多,看着他们的成长。

从云下到云上

传统的数据库厂商会上门谈生意,大多都是大客户或者是重要业务,业务的重要程度随着我国技术发展,对数据库的依赖程度会越来越高。相比云下 ,云上数据库的门槛较低,成本低就会有大规模的使用,在性能和分布性等方面会有各种需求,这样一轮轮的迭代,数据库的大需求是一个趋势,节奏会越来越快。

数据库从云下到云上的转换,也是中国国产数据库弯道超车的机会。借着国家的上升大势,各行各业都需要数据库,它会带动很多东西前进,需求会转化为对技术的变革倒推,再好的技术如果没有应用场景,都是无用的。

中国是世界上最大的数据库应用场景,目前,我们团队在做一款自研数据库。MySQL之所以火爆,是因为有大量的人使用,大量的人改进,大量的人扩展它的使用范围,致使它的能力得到很大提升,它是一个非常通用的数据库。在这种情况下,在此基础上想要有五倍、十倍的性能提升是非常难的。

我们摒弃了老方法,拥抱软硬件的大变革,比如RDMA的出现,也或者两台服务器间的RT 是7us,这与过去70us相差10倍;以前数据结构底层用的B-Tree是根据旋转磁盘设计的,今天如果仍然延用B-Tree,就不会有特别多的优势,我们需要更新的数据结构,更新的利用介质。通过这些技术的提升让很多不可能成为可能。

数据库本身设计时会考虑到很多东西,比如软件、网络技术包,多年来数据库的结构并没有什么变化,它的栈很深,一级级传递下来,我们不仅仅要跟上硬件的优势,还有赶上软件的步伐。传统的网络接收方式耗费很多CPU资源等,如今我们让其消耗更短更少。

POLARDB

在硬件红利的基础上,我们开发了全新的软件架构,让其很好的适配和驾驭硬件,当硬件和软件各方面都达到了极致,实现数量级的叠加时,我们是有可能创造出总体性能达到更好数量级的新东西。

POLARDB 就具备高性能特点,并且性价比很高,起初我们的设计目标并没有多大野心,只是希望当五年或十年后再回首时,我们会感觉到当初的设计是多么先进。

想要达到性价比高就必须有红利基础,性能高意味着成本低,另外我们从架构上去解决问题,比如过去MySQL是主备结构,完全被动接收,为了数据安全用户需要付两倍的钱,而且需要提供扩展和读写能力。而POLARDB 采用共享存储的模式,这得益于云计算的弹性能力,我们解决了存储扩展问题,一个实例可以扩展到P级别,这就解决了存储问题;还有延迟抖动问题,共享存储可以做到20~30us三副本落地,不需要再拷贝数据,天然解决很多问题;还有计算能力的扩展,我们的计算和存储是分离的,数据都是同步的,性能成本很低,无需再复制;数据库具有写能力,我们发散思维,对引擎做了大量改进,消减引擎使TPS或QPS能力提升5倍甚至10倍,进行物理复制,整个又是一个数量级的提升,因为很多公司可能一辈子都用不到容量的上限。

POLARDB 紧跟时代的步伐,尝试了他人不想尝试的,POLARDB 理念简单又直接。数据库的稳定性一直是重中之重,POLARDB 也十分注重稳定性问题。从第一天被设计开始,POLARDB 就被证明怎样才能如你预期工作,将认可的状态可视化,从根本上减少问题的发生,即使发生情况,我们也会很快知道,我们从代码、引擎、管控到支撑等拥有全套的解决方案,我们希望POLARDB 的稳定性也会有很大的提升。

 

点此免费试用云数据库POLARDB 

相关实践学习
使用PolarDB和ECS搭建门户网站
本场景主要介绍基于PolarDB和ECS实现搭建门户网站。
阿里云数据库产品家族及特性
阿里云智能数据库产品团队一直致力于不断健全产品体系,提升产品性能,打磨产品功能,从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手,打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系, 结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台,为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案,提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。
相关文章
|
8天前
|
人工智能 多模数据库 Cloud Native
揽获多项殊荣,阿里云瑶池数据库亮相2024可信数据库发展大会
在2024可信数据库发展大会上,阿里云被选为中国信通院数据库金融工作组共建单位。同时,阿里云Lindorm成为首批通过中国信通院多模数据库产品测试的产品,展示出在多模数据处理能力上的领先性。
|
21天前
|
SQL 数据库 微服务
微服务03,最简单的Demo,我们每个服务不能重复开发相同业务,微服务数据独立,不要访问其他微服务的数据库,微服务的特点之一是提供不能功能的数据库互相分割,微服务需要根据业务模块拆分,做到单一职责,
微服务03,最简单的Demo,我们每个服务不能重复开发相同业务,微服务数据独立,不要访问其他微服务的数据库,微服务的特点之一是提供不能功能的数据库互相分割,微服务需要根据业务模块拆分,做到单一职责,
|
4天前
|
存储 SQL 关系型数据库
数据库事务:确保数据完整性的关键20
【7月更文挑战第20天】事务是数据库操作的基本逻辑单位,确保数据一致性。ACID原则包括:原子性(操作全成或全败),一致性(事务前后数据合法性),隔离性(并发操作互不影响),持久性(提交后更改永久保存)。MySQL的InnoDB引擎支持事务,通过undo log实现回滚,redo log确保数据持久化。开启事务可使用`BEGIN`或`START TRANSACTION`,提交`COMMIT`,回滚`ROLLBACK`。
131 70
|
18天前
|
缓存 运维 关系型数据库
数据库容灾 | MySQL MGR与阿里云PolarDB-X Paxos的深度对比
经过深入的技术剖析与性能对比,PolarDB-X DN凭借其自研的X-Paxos协议和一系列优化设计,在性能、正确性、可用性及资源开销等方面展现出对MySQL MGR的多项优势,但MGR在MySQL生态体系内也占据重要地位,但需要考虑备库宕机抖动、跨机房容灾性能波动、稳定性等各种情况,因此如果想用好MGR,必须配备专业的技术和运维团队的支持。 在面对大规模、高并发、高可用性需求时,PolarDB-X存储引擎以其独特的技术优势和优异的性能表现,相比于MGR在开箱即用的场景下,PolarDB-X基于DN的集中式(标准版)在功能和性能都做到了很好的平衡,成为了极具竞争力的数据库解决方案。
|
9天前
|
SQL DataWorks 关系型数据库
DataWorks产品使用合集之数据集成时源头提供数据库自定义函数调用返回数据,数据源端是否可以写自定义SQL实现
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
6天前
|
存储 负载均衡 定位技术
现代数据库系统中的数据分片策略与优化
数据分片在现代数据库系统中扮演着关键角色,特别是在面对海量数据和高并发访问的情况下。本文探讨了数据分片的基本概念、常见的分片策略(如水平分片与垂直分片)、以及如何通过优化和选择合适的分片策略来提升数据库系统的性能和可扩展性。
|
8天前
|
数据采集 分布式计算 大数据
MaxCompute产品使用合集之数据集成中进行数据抽取时,是否可以定义使用和源数据库一样的字符集进行抽取
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
10天前
|
存储 消息中间件 容灾
|
10天前
|
Java 关系型数据库 数据库
实时计算 Flink版产品使用问题之如何将增量数据直接写入下游数据库
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
10天前
|
消息中间件 SQL Kafka
实时计算 Flink版产品使用问题之如何实现两个阿里云账号下的Kafka进行数据的互相传输
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。

热门文章

最新文章