1.count 数据丢失
当某列存在 NULL
值时,再使用 count
查询该列,就会出现数据“丢失”问题,如下 SQL 所示:
select count(*),count(name) from person;
查询执行结果如下:
从上述结果可以看出,当使用的是 count(name)
查询时,就丢失了两条值为 NULL
的数据丢失。
解决方案
如果某列存在 NULL
值时,就是用 count(*)
进行数据统计。
扩展知识:不要使用 count(常量)
阿里巴巴《Java开发手册》强制规定:不要使用 count(列名) 或 count(常量) 来替代 count(),count() 是 SQL92 定义的标准统计行数的语法,跟数据库无关,跟 NULL 和非 NULL 无关。
说明:count(*) 会统计值为 NULL 的行,而 count(列名) 不会统计此列为 NULL 值的行。
2.distinct 数据丢失
当使用 count(distinct col1, col2)
查询时,如果其中一列为 NULL
,那么即使另一列有不同的值,那么查询的结果也会将数据丢失,如下 SQL 所示:
select count(distinct name,mobile) from person;
查询执行结果如下:
数据库的原始数据如下:
从上述结果可以看出手机号一列的 10 条数据都是不同的,但查询的结果却为 8。