关系数据库如何快速查询表的记录数

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS SQL Server Serverless,2-4RCU 50GB 3个月
推荐场景:
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
简介: 在数据库中,很多人员习惯使用SELECT COUNT(*)、SELECT COUNT(1)、SELECT COUNT(COL)来查询一个表有多少记录,对于小表,这种SQL的开销倒不是很大,但是对于大表,这种查询表记录数的做法就是一个非常消耗资源了,而且效率很差。

    在数据库中,很多人员习惯使用SELECT COUNT(*)、SELECT COUNT(1)、SELECT COUNT(COL)来查询一个表有多少记录,对于小表,这种SQL的开销倒不是很大,但是对于大表,这种查询表记录数的做法就是一个非常消耗资源了,而且效率很差。下面介绍一下SQL Server、 Oracle、MySQL中如何快速获取表的记录数。

 

SQL SERVER 数据库

 

在SQL Server数据库中, 对象目录视图sys.partitions中有一个字段rows会记录表的记录数。我们以AdventureWorks2014为测试数据库。

 

 

 
SELECT OBJECT_NAME(object_id)    AS Object_Name, 
       i.name                    AS Index_Name,
       p.rows                    AS Table_Rows
FROM sys.partitions  p
LEFT JOIN sys.sysindexes i ON p.object_id = i.id AND  p.index_id = i.indid  
WHERE
     object_id = OBJECT_ID('TableName') 

 

 

那么我们还有一些疑问,我们先来看看这些问题吧!

 

   1:没有索引的表是否也可以使用上面脚本?

   2:只有非聚集索引的堆表是否可以使用上面脚本?

   3:有多个索引的表,是否记录数会存在不一致的情况?

   4:统计信息不准确的表,是否rows也会不准确

   5: 分区表的情况又是怎么样?

   6:对象目录视图sys.partitions与sp_spaceused获取的表记录函数是否准确。

 

如下所示,我们先构造测试案例:

IF EXISTS(SELECT 1 FROM sys.objects WHERE type='U' AND name='TEST_TAB_ROW')
BEGIN
    DROP TABLE TEST_TAB_ROW;
END
 
IF NOT EXISTS(SELECT 1 FROM sys.objects WHERE type='U' AND name='TEST_TAB_ROW')
BEGIN
        CREATE TABLE TEST_TAB_ROW
        (
            ID        INT,
            NAME      CHAR(200)
        )
END
GO
 
SET NOCOUNT ON;
BEGIN TRAN
DECLARE @Index INT =1;
 
WHILE @Index <= 100000
BEGIN
 
    INSERT INTO TEST_TAB_ROW
    VALUES(@Index, NEWID());
 
    SET @Index+=1;
    
    IF (@Index % 5000)  = 0 
       BEGIN
        IF @@TRANCOUNT > 0 
            BEGIN 
                COMMIT;
                BEGIN TRAN
            END
    END
END
 
IF @@TRANCOUNT > 0 
BEGIN 
    COMMIT;
END
GO

 

关于问题1、问题2,都可以使用上面脚本, 如下测试所示:

 

SELECT OBJECT_NAME(object_id)    AS Object_Name, 
       i.name                    AS Index_Name,
       p.rows                    AS Table_Rows
FROM sys.partitions  p
LEFT JOIN sys.sysindexes i ON p.object_id = i.id AND  p.index_id = i.indid  
WHERE
     object_id = OBJECT_ID('dbo.TEST_TAB_ROW') 

 

在表dbo.TEST_TAB_ROW 上创建非聚集索引后,查询结果如下所示:

 

CREATE INDEX IX_TEST_TAB_ROW ON TEST_TAB_ROW(ID);

 

 

我们插入500条记录,此时,这个数据量不足以触发统计信息更新,如下所示, Rows Sampled还是1000000

DECLARE @Index INT =1;
 
WHILE @Index <= 500
BEGIN
 
    INSERT INTO TEST_TAB_ROW
    VALUES(100000 +@Index, NEWID());
 
    SET @Index+=1;
    
END

 

 

如下所示,发现sys.partitions中的记录变成了100500了,可见rows这个值的计算不依赖统计信息。

 

 

当然,如果你用sp_spaceused,发现这里面的记录也是100500

sp_spaceused 'dbo.TEST_TAB_ROW'

 

关于问题3:有多个索引的表,是否记录数会存在不一致的情况?

 

   答案:个人测试以及统计来看,暂时发现多个索引的情况下,sys.partitions中的rows记录数都是一致的。暂时没有发现不一致的情况,当然也不排除有特殊情况。

 

关于问题5: 分区表的情况又是怎么样?

 

   答案:分区表和普通表没有任何区别。

 

关于问题6:对象目录视图sys.partitions与sp_spaceused获取的表记录函数是否准确?

 

   答案:对象目录视图sys.partitions与sp_spaceused获取的表记录数是准确的。

 

 

ORACLE 数据库

 

在ORACLE数据库中,可以通过DBA_TABLES、ALL_TABLES、USER_TABLES视图查看表的记录数,不过这个值(NUM_ROWS)跟统计信息有很大的关系,有时候统计信息没有更新或采样比例会导致这个值不是很准确。

SELECT OWNER     , 
       TABLE_NAME, 
       NUM_ROWS  ,
       LAST_ANALYZED
FROM   DBA_TABLES 
WHERE  OWNER = '&OWNER' 
       AND TABLE_NAME = '&TABLE_NAME'; 
 
 
SELECT OWNER,
      TABLE_NAME,
      NUM_ROWS  ,
      LAST_ANALYZED
FROM ALL_TABLES
WHERE OWNER   ='&OWNER'
AND TABLE_NAME='&TABLE_NAME';
 
 
SELECT TABLE_NAME,
       NUM_ROWS  ,
       LAST_ANALYZED
FROM USER_TABLES
WHERE TABLE_NAME='&TABLE_NAME'

 

更新统计信息后,就能得到准确的行数。所以如果需要得到正确的数据,最好更新目标表的统计信息,进行100%采样分析。对于分区表,那么就需要从dba_tab_partitions里面查询相关数据了。

 

SQL>execute dbms_stats.gather_table_stats(ownname => 'username', tabname =>'tablename', estimate_percent =>100, cascade=>true);

 

MySQL数据库

 

   在MySQL中比较特殊,虽然INFORMATION_SCHEMA.TABLES也可以查到表的记录数,但是非常不准确。如下所示,即使使用ANALYZE TABLE更新了统计信息,从INFORMATION_SCHEMA.TABLES中获取的记录依然不准确。

SELECT TABLE_ROWS 
FROM INFORMATION_SCHEMA.TABLES
WHERE TABLE_NAME='table_name'

 

mysql> SELECT TABLE_ROWS 
    -> FROM INFORMATION_SCHEMA.TABLES
    -> WHERE TABLE_NAME='jiraissue'
    -> ;
+------------+
| TABLE_ROWS |
+------------+
|      36487 |
+------------+
1 row in set (0.01 sec)
 
mysql> select count(*) from jiraissue;
+----------+
| count(*) |
+----------+
|    36973 |
+----------+
1 row in set (0.05 sec)
 
mysql> analyze table jiraissue;
+----------------+---------+----------+----------+
| Table          | Op      | Msg_type | Msg_text |
+----------------+---------+----------+----------+
| jira.jiraissue | analyze | status   | OK       |
+----------------+---------+----------+----------+
1 row in set (1.41 sec)
 
mysql> SELECT TABLE_ROWS 
    -> FROM INFORMATION_SCHEMA.TABLES
    -> WHERE TABLE_NAME='jiraissue';
+------------+
| TABLE_ROWS |
+------------+
|      34193 |
+------------+
1 row in set (0.00 sec)
 
mysql> 

image

 

如上所示,MySQL这种查询表记录数的方法看来还是有缺陷的。当然如果不是要求非常精确的值,这个方法也是不错的。

 

当然,上面介绍的SQL Server、Oracle、MySQL数据库中的方法,还是有一些局限性的。例如,只能查询整张表的记录数,对于那些查询记录数带有查询条件(WHERE)这类SQL。还是必须使用SELECT COUNT(*)这种方法。

相关文章
|
26天前
|
SQL 关系型数据库 MySQL
学成在线笔记+踩坑(3)——【内容模块】课程分类查询、课程增改删、课程计划增删改查,统一异常处理+JSR303校验
课程分类查询、课程新增、统一异常处理、统一封装结果类、JSR303校验、修改课程、查询课程计划、新增/修改课程计划
学成在线笔记+踩坑(3)——【内容模块】课程分类查询、课程增改删、课程计划增删改查,统一异常处理+JSR303校验
|
26天前
|
前端开发 应用服务中间件 API
|
13天前
|
存储 关系型数据库 MySQL
查询服务器CPU、内存、磁盘、网络IO、队列、数据库占用空间等等信息
查询服务器CPU、内存、磁盘、网络IO、队列、数据库占用空间等等信息
81 5
|
1天前
|
SQL NoSQL 数据管理
超越查询语言:GQL 如何塑造图形数据库的未来
超越查询语言:GQL 如何塑造图形数据库的未来
8 0
|
1月前
|
存储 关系型数据库 MySQL
如何优化数据库查询?
如何优化数据库查询?
69 1
|
2月前
|
SQL 缓存 监控
优化大型数据库查询的最佳实践
在处理大规模数据时,数据库查询性能的优化至关重要。本文探讨了几种优化大型数据库查询的最佳实践,包括索引策略、查询重写、数据分区和缓存机制。通过这些方法,开发人员可以显著提高查询效率,减少系统负担,提升用户体验。本文还结合实际案例,提供了具体的优化技巧和工具建议,帮助读者有效地管理和优化大型数据库系统。
|
27天前
|
SQL 存储 数据库
MSSQL遍历数据库根据列值查询数据
【9月更文挑战第12天】在 SQL Server 中,可以通过游标或临时表遍历数据库并根据列值查询数据。示例展示了如何创建临时表存储数据库名,并通过循环遍历这些名称来执行特定查询。需替换 `YourTableName`、`YourColumnName` 和 `YourValue` 为实际值。此方法要求有足够权限访问各数据库。若无跨库权限,需分别执行查询。
|
2月前
|
SQL 数据库 Java
HQL vs SQL:谁将统治数据库查询的未来?揭秘Hibernate的神秘力量!
【8月更文挑战第31天】Hibernate查询语言(HQL)是一种面向对象的查询语言,它模仿了SQL的语法,但操作对象为持久化类及其属性,而非数据库表和列。HQL具有类型安全、易于维护等优点,支持面向对象的高级特性,内置大量函数,可灵活处理查询结果。下面通过示例对比HQL与SQL,展示HQL在实际应用中的优势。例如,HQL查询“从员工表中筛选年龄大于30岁的员工”只需简单地表示为 `FROM Employee e WHERE e.age &gt; 30`,而在SQL中则需明确指定表名和列名。此外,HQL在处理关联查询时也更为直观易懂。然而,对于某些复杂的数据库操作,SQL仍有其独特优势。
41 0
|
2月前
|
API Java 数据库连接
从平凡到卓越:Hibernate Criteria API 让你的数据库查询瞬间高大上,彻底告别复杂SQL!
【8月更文挑战第31天】构建复杂查询是数据库应用开发中的常见需求。Hibernate 的 Criteria API 以其强大和灵活的特点,允许开发者以面向对象的方式构建查询逻辑,同时具备 SQL 的表达力。本文将介绍 Criteria API 的基本用法并通过示例展示其实际应用。此 API 通过 API 构建查询条件而非直接编写查询语句,提高了代码的可读性和安全性。无论是简单的条件过滤还是复杂的分页和连接查询,Criteria API 均能胜任,有助于提升开发效率和应用的健壮性。
71 0
|
2月前
|
Java UED 开发者
当错误遇上Struts 2:一场优雅的异常处理盛宴,如何让错误信息成为用户体验的救星?
【8月更文挑战第31天】在Web应用开发中,异常处理对确保用户体验和系统稳定性至关重要。Struts 2 提供了完善的异常处理机制,包括 `exception` 拦截器、`ActionSupport` 类以及 OGNL 表达式,帮助开发者优雅地捕获和展示错误信息。本文详细介绍了 Struts 2 的异常处理策略,涵盖拦截器配置、错误信息展示及自定义全局异常处理器的实现方法,使应用程序更加健壮和用户友好。
39 0