《PolarDB for PostgreSQL源码与应用实战》——如何参与贡献PolarDB for PostgreSQL开源(中)

本文涉及的产品
云原生数据库 PolarDB PostgreSQL 版,标准版 2核4GB 50GB
云原生数据库 PolarDB MySQL 版,通用型 2核8GB 50GB
简介: 《PolarDB for PostgreSQL源码与应用实战》——如何参与贡献PolarDB for PostgreSQL开源(中)

《PolarDB for PostgreSQL源码与应用实战》——如何参与贡献PolarDB for PostgreSQL开源(上) https://developer.aliyun.com/article/1232498?spm=a2c6h.13148508.setting.18.5e4f4f0ecmbIFO


开发规范


下面介绍一下开发规范。

大家都知道开发规范对于平时开发工作有重要的作用,但是开发人员平时对开发规范可能关注得不够,但是作为开源项目,开发规范显得尤为重要。


大家都知道这些年PG社区发展非常快,每年都有大版本的发布,他们实际上就是通过一些标准的开发规范,包括一些制度,然后能联合全世界各个国家无数优秀的开发人员,使其协同开发出高质量的代码。所以开发规范在开源项目中就好比一套标准,只要大家做出来的东西符合这套标准,就有了共同沟通的语言,它是一个开源项目能否良好持续发展的关键之一,我们的PolarDB-for-PostgreSQL依然坚持这套标准。


下面将简单介绍一下经常使用的一些规范,希望这些规范能帮助大家在开发过程中更得心应手,提升开发的代码质量,更加符合国际规范,为自己以后的发展提供一个好的支撑。


(一)编码习惯—C语言格式规定

image.png


由于我们的代码大部分都是用C语言开发,因此这里主要介绍一些C语言的开发规范。首先是缩进,可能大家在过去的开发过程中被告知不要使用这种制表服务,就是我们Tab键。实际上PG要求使用tab键,而且是用4列制表符,大家使用时要遵循这个标准,因为所有的代码都是基于这个标准做的。布局规则,比如大括号的位置信息怎么放置,它要遵循BSD习惯,特别是一些if、while、switch等受控块的花括号,受控块的花括号要独自占一行。还有是限制行长度,比如每行的长度建议在80列宽度上,这个是为了代码的可读性,如果代码写得太长,可能不利于代码的阅读。那是否就不能超过80列?也不是,比如说我们的一些errormsg可能会写得很长,如果为了80列的宽度限制而在任意位置进行切断,就会影响可读性,所以目的还是为了可读性。在保证最大可读性的情况下,我们要尽量保证80列的宽度限制。


除此之外,不要使用C++的一些注释风格,比如说双斜杠,还有C编译器,实际上是不接受这种注释的。出于相同的原因,我们也不推荐使用C++的扩展,比如在一个控制块中的一些变量的声明,比如说for语句,for语句如果在控制块里边,声明一个变量I,在这里边是不允许的,需要把这个声明变量拿到for控制框外面的。然后要follow一下注释的模式,通过这种多行注释块去填注释。


(二)编码习惯—如何报错


下面主要讲一下我们的报错信息。


image.png


作为开发人员,知道输出日志信息是我们和软件用户之间一个重要的交流手段,输出的正确日志信息尤其重要,为什么呢?因为它告诉客户我们是否专业,如果写的信息很随意的,客户看到这个软件注册信息的时候,不论你是否写了一个非常优秀的算法或功能,从用户的角度来看,他都会认为这个软件产品不够专业。因此,往往我们忽略的东西可能非常关键。产品里报错信息主要通过两个函数来实现的,分别是ereport和elog。首先讲一下ereport,可以看到ereport这个语句主要分三部分,error就是我们的严重级别,errcode就是一些错误代码,最后是errmsg。严重级别根据PG里边的一些规范,我们这里规定是用DEBUG5到DEBUG1,包括我们的NOTICED、WARNING、ERROR、FATAL、PANIC,随着级别越来越高,对于客户的信息产生了不同的重要程度,也可以通过我们的配置文件设置给客户输出什么级别的信息。


如果是error或者更高,需要注意的是如果严重级别没有设置,或者说严重级别设置了error或者更高ereport,会终止用户定义函数的执行,并且不会返回到调用者。如果是严重级别低于error,那ereport会正常返回。errcode指定对于该情况的一些错误标识代码,这里的错误代码一般由5个字符组成,这5个字符包含了一些数字和大写字母,它表示多种错误和警告情况的代码,所以它也是分层次的。


前两位一个是错误的总分类,后三个字符表示一个情况的子类,代码5个0,“00000”代表着一个成功的状态,这可以帮助我们快速定位问题的类型,也大概知道debug的方向在哪里。如果没有指定errcode错误严重性,特别是error或者更高的错误标识,会默认使用ERRCODE_INTERNAL_ERROR。如果错误级别是warning标识符的这种,errcode会默认使用ERRCODE_WARNING 。


如果错误严重级别是在notice以及以下,就会使用ERRCODE_SUCCESSFUL_COMPLETION这么一个errcode,这是一个默认的情况,如果没有设置errcode的话。


对于我们来讲,有的时候不用errcode是一个很方便的情况,但是如果考虑不用errcode,要很清楚自己不用的原因是什么,考虑一下它们是否合适。


剩下就是errmsg。errmsg主要是提供消息主体,就是要报错的信息。然后就是ereport,ereport这里边实际上还有很多辅助函数,就里提到了我们的errcode(),errmsg()这里边都是辅助函数,还有很多其他的辅助函数,这些辅助函数大家可以在PG的官网上进行查看。


下面讲第二种错误代码elog。


elog的作用是什么?它是一个旧有的模式,可以等效于ereport模式,可以看到它提供了level,错误级别是一样的,但它没有提供errcode,就跟刚才讲到的,根据严重级别提供默认的errcode。然后消息通过一个辅助函数errmsg_internal()去show出来,过程和刚才讲到的ereport里面的errmsg是不同的,errmsg()根据地域设置设定,比如它可以翻译成对应国家的语言,比如说翻译成汉语,实际上errmsg_internal()这个语言就不会受翻译的限制,它可以自动把原的语言打印出来。


为什么还要保留这种旧有的模式呢?因为它足够简洁,在有一些内部的错误,比如说PG内核一些内部错误的时候,这种错误实际上它并不是给用户show出来的,不是用户感兴趣的错误,可以用这种简洁的模式进行打印,非常方便,因此也得到了保留。


(三)编码习惯—错误消息如何撰写

image.png


下面我们讲讲消息怎么输出,这也是很关键的一个步骤。


错误消息通常分成三部分,主要的错误消息是简单概要的介绍一下这是什么错误,如果这个简单概要的信息不够完整,或者不能够足够表达出具体的错误,也可以通过添加Detail信息,把具体的细节打印出来。

同时,如果你提供了比如对错误的一些修复建议,可以通过这种Hint的方式进行加入,比如可以提供一下这个东西是不是文件不见了,可以去做一些文件添加等提示信息。


然后就是引号,因为在引用时,英文文本都应该使用双引号,我们通常用这个引号界定文件名,包括用户提供的一些标识服务,以及其他可能包含词的变量,不要用他们标记那些不包含词的变量。为什么要这么做?实际上因为我们有一些对象插入到信息中是会产生歧义的,如果不用双引号,那就产生了歧义,把它插到消息中,通过双引号可以避免歧义。


还有就是语法和标点类主要错误信息,例如通常第一个字母不要大写,不要用一个句点结束一个消息,甚至不要考虑用一个感叹号结束一个消息。


关于详细和提示信息,尽量要使用完整的句子,并且每一句都要用句点结束,对句子的第一个词进行首字母大写,如果后面跟着另一个句子,在句号后面放两个空格。


为什么有这些具体的建议或规范,比如主要消息为什么不要大写?第一个字母怎么不要大写?因为这些消息对于用户来讲,他会把你的信息很方便插入到各种各样语法的上下文中,如果用完整句子可能就不方便。因为通常来讲,主要消息通常不是一个语法上完整的句子,如果它是一个很长的句子,尽量把它拆分成一个主要部分和一个详细部分。不过详细和提示消息会很长,通常需要包括多个句子,为了一致,即使它们只是一个句子,也应该遵循完整句子的风格,我们要求它的首字母大写,每个句都句点结束。

image.png


关于大写和小写方面,对消息使用小写的这种形式,主要错误消息里面第一个字母也要小写,如果是SQL命令,一些关键词出现在消息中,请为它们使用大写,因为这也是为了明确告诉大家这些信息。然后避免用被动态,尽量使用主动语态,


在有主语时使用完整的句子,比如说类似于“A could not do B”,如果主语是程序本身,请使用没有主语的电报风格,但不要为程序加上“I”。因为程序并不是人,所以不需要去假装。


现在时和过去时,如果一次尝试做某事失败,但是可能下一次就成功了,就使用过去式,如果失败必定是持久的,那就使用现在时。比如下面这两个句“could not open”和“cannot open”有什么区别?第一个表示打开文件尝试失败,该消息应该给出一个具体的原因,比如说磁盘满了或者是文件不存在,过去时更合适,因为下一次磁盘可能就不满了,或者是文件就存在了。第二种形式表示打开所提及文件的功能在程序中根本就不存在,或者概念上是不可能的,现在时更合适,因为在该种情况将无限保持的情况下,这种错误也将无限保持。因为你的功能没有,即使文件存在,也没有这个功能,为什么要这样呈现?普通用户没有能力从消息的时态上得出重要的结论的,但是由于语言给我们提供了语法,就应该正确地使用它。

image.png


关于对象类型,在引用一个对象名称时,说明该对象的类型,因为如果不说明它就没有人会了解这个对象是什么类型,比如 “foo.bar.baz”具体是什么东西,我们需要给它一个具体说明。


然后是组装错误消息。比如有一些消息是在别处生成的,这种产生的文本怎么嵌入到我们消息里面。消息总是要说明为什么错误会发生,如果没有已知的原因,最好去修复这个代码。比如一个错误的实例“could not open file”,这种没有给的原因,没有给原因就不确定错误的信息是怎么产生的。最好的是说比如“could not open file”,然后改给它一个I/O failure,是因为I/O错误导致的。


不要在消息中使用函数名,可能大家开发过程中经常会在日志里用到这个函数名,但是日志写函数名实际上对用户来讲是没有任何作用的,因为他不清楚你在里边实现什么样的,请大家把函数名保留在debug阶段,最后提交的时候还是要把函数名去掉,写成一个合规的错误消息。避免缩略语,比如尽量不要使用“can't”,应该使用“cannot”。避免使用“Unable、Bad、Illegal、Unknown”这种单词,为什么?比如说unable,它更接近于被动态,使用“cannot”等会更好。比如bad  result这种错误信息,实际上很难从错误信息中知道到底是什么东西,最好是写出一个结果不好原因,比如Invalid format,是一个无效的格式。Illegal表示违反法律,最好是写成Invalid,如果说明为什么无效就更好了。尝试避免Unknown,为什么?比如说Unknown responds,如果你不知道响应是什么,怎么知道它是错误的?应该使用Unrecognized,相当于没有识别或这是一个更好的选择。


Find and Exists,找到还是存在的问题。如果是使用了某个算法去查找,而算法执行失败了,就用“无法找到”更好,如果是已知的资源位置,但是程序无法去找到它,那“不存在”会更合适一点。


(四)编码习惯—其他编码习惯

下面介绍一下其他的一些编码习惯。

image.png


比如我们在C语言里一些宏和内联函数,因为带有参数的宏和内联函数在代码中经常会被使用,当使用宏时有多次计算风险的时候,就推荐使用后者,如果是其他情况,只能尽量去使用宏,因为宏使用起来会更容易一点。

信号处理函数是一个很重要的部分,因为除了一些特殊的代码,信号处理函数处理不好会导致程序混乱,在信号处理器中,只应该调用那些对异步信息安全的函数,比如在处理信号的时候去操作一个锁,这个锁是在外部调用的,已经锁上了,此时信号处理函数中要去加这个锁可能会发生什么,大家清楚。在这里推荐只是提示一下这个信号已经到达,并用一个 latch 去唤醒信号处理器之外的一些代码,比如记录一下这是一个sigh up信号,同时去唤醒一些其他代码去执行。

image.png


还有就是调用函数指针,如果函数指针是个简单的变量,调用的时候推荐显式调用,虽然不加也是会有效的。

(五)编码习惯—其他语言编码规范

image.png


如上所示,还有一些其他的开发规范。因为我们不仅有C语言,还有其他的语言,大家自行参考上方地址的信息,参考对应的代码规范。


《PolarDB for PostgreSQL源码与应用实战》——如何参与贡献PolarDB for PostgreSQL开源(下) https://developer.aliyun.com/article/1232495?spm=a2c6h.13148508.setting.20.5e4f4f0ecmbIFO




相关实践学习
使用PolarDB和ECS搭建门户网站
本场景主要介绍基于PolarDB和ECS实现搭建门户网站。
阿里云数据库产品家族及特性
阿里云智能数据库产品团队一直致力于不断健全产品体系,提升产品性能,打磨产品功能,从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手,打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系, 结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台,为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案,提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。
相关文章
|
1月前
|
Cloud Native 关系型数据库 分布式数据库
让PolarDB更了解您--PolarDB云原生数据库核心功能体验馆
让PolarDB更了解您——PolarDB云原生数据库核心功能体验馆,由阿里云数据库产品事业部负责人宋震分享。内容涵盖PolarDB技术布局、开源进展及体验馆三大部分。技术布局包括云计算加速数据库演进、数据处理需求带来的变革、软硬协同优化等;开源部分介绍了兼容MySQL和PostgreSQL的两款产品;体验馆则通过实际操作让用户直观感受Serverless、无感切换、SQL2Map等功能。
118 7
|
1月前
|
运维 关系型数据库 分布式数据库
阿里云PolarDB:引领云原生数据库创新发展
阿里云PolarDB引领云原生数据库创新,2024云栖大会将分享其最新发展及在游戏行业的应用。PolarDB凭借弹性、高可用性、多写技术等优势,支持全球80多个站点,服务1万多家企业。特别是针对游戏行业,PolarDB助力Funplus等公司实现高效运维、成本优化和业务扩展。通过云原生能力,PolarDB推动游戏业务的全球化部署与快速响应,提升用户体验并保障数据安全。未来,PolarDB将继续探索AI、多云管理等前沿技术,为用户提供更智能的数据基础设施。
|
1月前
|
关系型数据库 MySQL 分布式数据库
[PolarDB实操课] 05.通过源码部署PolarDB-X标准版
本课程介绍如何通过源码部署PolarDB-X标准版,涵盖基于Paxos的MySQL三副本工作原理和技术特点。主要内容包括: 1. **Paxos三副本工作原理**:讲解Leader和Follower节点的角色及数据同步机制。 2. **技术特点**:强调高性能、数据不丢失(RPO=0)和自动HA切换。 3. **源码部署步骤**:详细演示从编译生成RPM包到启动DN节点的过程,包括配置my.cnf文件和初始化数据库。 4. **高可用体验**:通过三台机器模拟三副本集群,展示Leader选举和故障转移机制,确保数据一致性和服务可用性。
|
1月前
|
关系型数据库 编译器 分布式数据库
PolarDB实操课] 04.通过源码部署PolarDB-X企业版
本次课程由PolarDB开源架构师王江颖分享,详细介绍了通过源码部署PolarDB-X企业版的全过程。主要内容包括: 1. **编译基础** 2. **使用源码编译部署PolarDB-X企业版** 3. **演示实例**:通过阿里云ECS进行实际操作演示,从创建用户、赋予权限到最终启动并连接PolarDB-X数据库,展示了完整的部署过程。 4. **总结**
|
3月前
|
数据库
|
5月前
|
存储 关系型数据库 分布式数据库
揭秘PolarDB:中国云原生数据库的超级英雄,如何颠覆传统数据存储?
在数字化时代,数据成为企业的核心资产,而云原生数据库则是推动企业转型的关键。PolarDB凭借其先进的存储计算分离架构,在性能、可靠性和易用性方面脱颖而出,成为国内领先的选择。它支持多种数据库引擎,提供多副本存储机制,并采用按量付费模式,有效降低管理和成本压力,助力企业实现高效、可靠的数字化转型。
106 1
|
6天前
|
存储 容灾 关系型数据库
PolarDB开源数据库进阶课11 激活容灾(Standby)节点
本文介绍了如何激活PolarDB容灾(Standby)节点,实验环境依赖于Docker容器中用loop设备模拟共享存储。通过`pg_ctl promote`命令可以将Standby节点提升为主节点,使其能够接收读写请求。激活后,原Standby节点不能再成为PolarDB集群的Standby节点。建议删除对应的复制槽位以避免WAL文件堆积。相关操作和配置请参考系列文章及视频教程。
18 1
|
6天前
|
存储 NoSQL 关系型数据库
PolarDB开源数据库进阶课17 集成数据湖功能
本文介绍了如何在PolarDB数据库中接入pg_duckdb、pg_mooncake插件以支持数据湖功能, 可以读写对象存储的远程数据, 支持csv, parquet等格式, 支持delta等框架, 并显著提升OLAP性能。
19 0
|
6天前
|
存储 关系型数据库 分布式数据库
PolarDB开源数据库进阶课15 集成DeepSeek等大模型
本文介绍了如何在PolarDB数据库中接入私有化大模型服务,以实现多种应用场景。实验环境依赖于Docker容器中的loop设备模拟共享存储,具体搭建方法可参考相关系列文章。文中详细描述了部署ollama服务、编译并安装http和openai插件的过程,并通过示例展示了如何使用这些插件调用大模型API进行文本分析和情感分类等任务。此外,还探讨了如何设计表结构及触发器函数自动处理客户反馈数据,以及生成满足需求的SQL查询语句。最后对比了不同模型的回答效果,展示了deepseek-r1模型的优势。
28 0
|
6天前
|
存储 关系型数据库 分布式数据库
PolarDB开源数据库进阶课14 纯享单机版
PolarDB不仅支持基于“共享存储+多计算节点”的集群版,还提供类似开源PostgreSQL的单机版。单机版部署简单,适合大多数应用场景,并可直接使用PostgreSQL生态插件。通过Docker容器、Git克隆代码、编译软件等步骤,即可完成PolarDB单机版的安装与配置。具体操作包括启动容器、进入容器、克隆代码、编译软件、初始化实例、配置参数及启动数据库。此外,还有多个相关教程和视频链接供参考,帮助用户更好地理解和使用PolarDB单机版。
18 0

相关产品

  • 云原生数据库 PolarDB