背景
修改PG源码时,在elog.c文件中准备调用timestamp.c中的TimestampTz GetCurrentTimestamp(void)
,以获取当前时间,TimestampTz
是个int64类型,但是返回值类型不是期望的(是个int32值),但是在另外一个文件postgres.c调用返回的是正常的,如下:
elog.c: GetCurrentTimestamp() = 3891376011
postgres.c: GetCurrentTimestamp() = 495621643471576
也就是说,同一个函数在不同文件返回值的长度完全不同!
原因调查
首先查看具体函数定义GetCurrentTimestamp()
,怀疑是elog.c没有宏定义HAVE_INT64_TIMESTAMP
,随后gdb调试查看,最终计算的结果result确实是int64的值,当这个函数返回之后得到的值却变成了int32的值。
TimestampTz
GetCurrentTimestamp(void)
{
TimestampTz result;
struct timeval tp;
gettimeofday(&tp, NULL);
result = (TimestampTz) tp.tv_sec -
((POSTGRES_EPOCH_JDATE - UNIX_EPOCH_JDATE) * SECS_PER_DAY);
#ifdef HAVE_INT64_TIMESTAMP
result = (result * USECS_PER_SEC) + tp.tv_usec;
#else
result = result + (tp.tv_usec / 1000000.0);
#endif
return result;
}
难道elog.c调用的不是timestamp.c中这个函数?继续在源码中查找这个GetCurrentTimestamp
函数定义,看是否有多个定义。但是查找的结果是除了这个文件有定义,其他文件都没有这个函数定义,并且在timestamp.c这个函数中添加debug信息也都打印出来了,现在可以确定是函数返回的时候将int64转成int32了。百思不得其解之际,最后在编译日志中发现一个warning:
elog.c:2245: warning: implicit declaration of function ‘GetCurrentTimestamp’
在网上搜了一下,这种警告是由于函数未声明引起的,但是GetCurrentTimestamp()
在timestamp.h中声明了,通过对比postgres.c和elog.c include的头文件发现区别:postgres.c包含#include "utils/timestamp.h"
,也就是在postgres.c 中含有GetCurrentTimestamp
的函数声明,而在elog.c中却没有。在通过测试发现,C程序如果在函数调用前,没有对函数作声明,则编译系统会把第一次遇到的该函数形式(函数定义或函数调用)作为函数的声明,并将函数类型默认为int 型!
解决方法
在elog.c中添加#include "utils/timestamp.h"
头文件,并查看编译日志看是否有其他这样的warning。重新配置编译选项,加上-Werror-implicit-function-declaration,将这种warning改成error,提前报错。
总结
对于这个warning需要重视,通过修改编译选项将其变成error,便于我们发现问题,错误发现的越早越好,避免在编译时忽略或者掩盖错误。如果不是这个函数返回值错误特别明显,它将有可能成为一个隐形的bug。