AliSQL · 社区动态 · 关于开源之后评论的评论

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS PostgreSQL Serverless,0.5-4RCU 50GB 3个月
推荐场景:
对影评进行热评分析
云数据库 RDS SQL Server,基础系列 2核4GB
简介: 背景AliSQL在云栖大会宣布开源,并有幸请到MySQL之父、MariaDB创始人Monty一起见证。我们在将消息公布到社区之后,也同时关注社区的反馈。以下是对于评论的评论。handshake protocol声音:以阿里的个性就是大多数开源了 push 到 github 后面就不怎么管了其实这么说的人并没有真正全面的去看阿里开源的趋势,大家会看到这几年的分支维护的是越来越

背景

AliSQL在云栖大会宣布开源,并有幸请到MySQL之父、MariaDB创始人Monty一起见证。

图1. AliSQL开源瞬间

我们在将消息公布到社区之后,也同时关注社区的反馈。以下是对于评论的评论。

handshake protocol

声音:以阿里的个性就是大多数开源了 push 到 github 后面就不怎么管了

其实这么说的人并没有真正全面的去看阿里开源的趋势,大家会看到这几年的分支维护的是越来越健康的。“后面就不怎么管“,这里的“后面”说得很有艺术性,除了天地之外没有什么东西是保证天长地久的。活跃三天和活跃三十年,只要停下来,你说的“后面”就都是对的。如果以这个为标准,那么不只是中国的开源分支,全世界的开源产品都是到“后面”就不维护的。

因此我们眼中的健康的开源会是什么样呢?我觉得最重要的是态度,然后是天时地利。
态度是:我们把开源分支和维护作为我们的一个小理想在保护。只要条件还允许,我们会持续维护。天时地利是:那些条件。

以 AliSQL 的开源策略来说,我们希望节奏上是RDS线上经过验证的、稳定使用的patch才发布到开源分支。所以我们可以保证的是,只要阿里云RDS的业务在,这个分支的维护就会持续
大家会看到我们接下来会每个季度至少发布两个Release Notes,把我们认为稳定的和有足够应用场景的patch发布到开源分支。
本次发布开源代码同时我们发布了新的Release Note,增加了TokuDB和秒杀场景功能 支持。

声音:Release Notes 里两个版本号竟然是一样的

其实版本号不同,你需要把发布日期也一起带进去看。AliSQL的版本策略是这样的,我们会持续 rebase 到官方最新或次新的GA版本,但是AliSQL要保持自己的更新节奏,因此我们的版本号格式是官方base版本+(发布日期)。

这样的好处是大家从版本号可以得到足够的信息,包括与自用 MySQL 的版本对比和分支活跃情况。

声音:issue#2 ~ issue#7 是什么鬼?也是 KPI 的一部分?

并不是所有事情都要跟 KPI 挂钩,尤其issue里的“赞”,没有意义。
作为分支管理者,对于外部参与者的称赞,我们只能表示感谢,然后关闭。难道还可以删除吗?话说好像 GitHub 也没有删除发言的功能,只能修改,总不能修改别人的评论。

至于内部的同学,在 issue 发“赞”我们是批评的。因为在github上最直接的赞,是Star;最有直接价值的赞,是提问题和改进建议;最有长远价值的赞,是提需求或者pull request。
比如上周末 @DarkiT 同学提的建议“建议官方帖个标准的my.cnf的配置” 就非常好,感谢。我们已经在 wiki 上更新了三个不同规格的推荐配置。

声音:就不能把优化合并到官方 MariaDB 或 MySQL 么?

如果所有的patch都能合并到MariaDB,我们又何必这么麻烦再单独维护一个分支呢。如果可以而没有这么做,MariaDB的创始人Monty肯定是第一个提出反对意见的。

实际上的情况是:

  1. 我们会把能够合并到MariaDB或MySQL的patch提交上去。这篇文章 里面提到的patch,其实就都是提交到MySQL,并已经被5.7合并入主干的patch;
  2. 有一些patch是不够general,但是我们觉得对某个垂直场景有效果的。

这里举个例子,AliSQL里面有 COMMIT_ON_SUCCESS 这个hint,作用是,如果带此hint的语句执行成功,事务就默认提交。这个有什么好处呢?正常的使用方法是更新、等待成功、发commit。加这个hit可以减少事务提交的最后一次交互,在系统压力大或者网络较长的场景下,这是可以减少事务持续时间,提升整体吞吐量的。

这样的 patch 其他分支未必会接受,但对我们自己和我们的用户来说,在一些场景下是有效的,我们就去维护。

展望:从公司力量到社区力量

“事实上很多成熟的开源项目都是商业公司主导或贡献的”(from @incompatible),此句为真相。
同时,我们也看到,一个成熟项目一定是社区力量一起来完成的。因此我们真诚希望在GitHub上能够看到pull request、功能需求、IDEA、测试结论。

相信每个公司的DBA都偶尔有这么一个想法:要是MySQL支持xxx这个功能,我就爽了。但是没有开发和维护能力?没有关系,提到issue中,如果这是一个在某个方向足够通用的需求,我们或者社区其他开发者,会去实现的。

阿里云RDS团队有没有做这件事情的驱动力呢?
有的,以现在RDS的用户量和覆盖场景,你的需求,也一定是一部分RDS用户的需求。

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
28天前
|
存储 Prometheus 监控
Prometheus 深度指南:设计理念 · PromQL · Exporter · Thanos
Prometheus 是一款开源的系统监控与报警工具,专为云原生环境设计。它采用拉取模型采集数据,内置高效的本地时序数据库(TSDB),支持丰富的指标类型和四个黄金指标(延迟、流量、错误、饱和度)。其查询语言 PromQL 功能强大,可灵活聚合和分析时间序列数据。此外,通过 Exporter 机制,Prometheus 能轻松扩展到各种系统和服务。针对大规模场景,Thanos 提供高可用解决方案,整合多 Prometheus 实例,实现全局视图和长期存储。整体架构简洁可靠,适用于动态分布式环境。
176 10
Prometheus 深度指南:设计理念 · PromQL · Exporter · Thanos
|
SQL 调度 Swift
【深入浅出】阿里自研开源搜索引擎Havenask日志查询
本次分享内容为Havenask的日志查询,文章包含了具体查询步骤和举例、实操演示,希望可以帮助大家更好的使用Havenask。
55415 0
|
存储 关系型数据库 MySQL
阿里秀MySQL高端玩法,300页亿级MySQL调优文档GitHub开源即巅峰
先听我说: 这两个月来,很多小伙伴留言问我618、双11各大电商后端的技术,最多的是关于系统压力暴增情况下如何进行MySQL数据库优化的。 今天就结合我自己工作中的真实案例和大家分享一下吧。
|
关系型数据库 MySQL 程序员
卷?阿里DBA首次公开MySQL调优笔记,竟让GitHub的程序员集体叫好
对于工作了两三年的技术人员来说,在实践上已经有了比较多的积累,解决过很多问题——可能通过sys schema查询事务锁等待解决了系统的并发问题;通过设计读写分离架构扩展了应用的读性能线性扩展问题 但是作为求知欲强的技术人员,我们急切地希望知其所以然,了解MySQL到底是怎么设计的,以及为什么这样设计,读写分离架构适应的场景有哪些?什么时候建议用分库分表?等等。
203 0
|
自然语言处理 搜索推荐 数据处理
首个基于交互式网页搜索的中文问答开源框架,清华、人大、腾讯联合发布WebCPM
首个基于交互式网页搜索的中文问答开源框架,清华、人大、腾讯联合发布WebCPM
178 0
|
数据库 数据库管理
大咖说·对话开源|企业如何用好开源数据库
企业数据库选型的通用原则有哪些? 企业如何抓住开源红利? 本期大咖说,阿里云数据库开源战役负责人惊玄携手吉利汽车集团DBA负责人胡志诚,与你分享关于企业如何用好开源数据库的一些思考与实践经验。
224 0
大咖说·对话开源|企业如何用好开源数据库
|
存储 SQL 机器学习/深度学习
MySQL · 内核特性 · 统计信息的现状和发展
简介我们知道查询优化问题其实是一个搜索问题。基于代价的优化器 ( CBO ) 由三个模块构成:计划空间、搜索算法和代价估计 [1] ,分别负责“看到”最优执行计划和“看准”最优执行计划。如果不能“看准”最优执行计划,那么优化器基本上就是瞎忙活,甚至会产生严重的影响,出现运算量特别大的 SQL ,造成在线业务的抖动甚至崩溃。在上图中,代价估计用一个多项式表示,其系数 c 反应了硬件环境和算子特性,而
379 0
MySQL · 内核特性 · 统计信息的现状和发展
|
机器学习/深度学习 人工智能 前端开发
IT 技术知识开源图谱等你参与|Code China
当前互联网上 IT 技术资料繁杂,进入某个领域学习某项技术,可能根本就不缺对应的资料,但是对于职业发展这块儿,相信很多初学者或者刚入门的人,对于自己今后的发展路线不甚清晰。CSDN 作为全球最大的中文开发者社区,同时在国内也有最大的开发者用户群体,为了更好的服务开发者,CSDN 联合阿里、字节跳动等企业以及技术专家打造了 IT 技术人才路线图,并在 Code China 上开源,希望吸引更多的专家和企业加入,对已有领域的图谱进行完善,或对未有的领域贡献图谱。图谱根据程序员职业发展规划,分为前端、后端、DevOps、测试、安全、云原生、AI、音视频、区块链等。
376 0
|
存储 缓存 NoSQL
PgSQL · 引擎介绍 · 向量化执行引擎简介
摘要 本文为大家介绍一下向量化执行引擎的引入原因,前提条件,架构实现以及它能够带来哪些收益。 希望读者能够通过对这篇文章阅读能够对向量化执行引擎的应用特征与架构有一个概要的认识。 关键字 向量化执行引擎, MonetDB,Tuple, 顺序访问,随机访问, OLAP, MPP,火山模型,列存表,编译执行 背景介绍 过去的20-30年计算机硬件能力的持续发展,使得计算机的计算能力飞速提升。然后
5945 1
|
资源调度 大数据 API
袋鼠云研发手记 | 数栈·开源:Github上400+Star的硬核分布式同步工具FlinkX
作为一家创新驱动的科技公司,袋鼠云每年研发投入达数千万,公司80%员工都是技术人员,袋鼠云产品家族包括企业级一站式数据中台PaaS数栈、交互式数据可视化大屏开发平台Easy[V]等产品也在迅速迭代。
3152 0