关于表数据行统计的问题和相关误区

简介:

数据库及其版本:SQL Server2008 原以为针对聚集索引列会快点,结果却是错误的。

 

--一个300多万记录的表,无任何索引,进行表扫描

select COUNT(*) from testcount

--'testcount'。扫描计数3,逻辑读取89181 次,物理读取1001 次,预读87602 次,lob 逻辑读取次,lob 物理读取次,lob预读次。

 

select COUNT(ProductID) from testcount

--'testcount'。扫描计数3,逻辑读取89181 次,物理读取915 次,预读82713 次,lob 逻辑读取次,lob 物理读取次,lob预读次。

 

create index testcount_pk on testcount(clusterPK)

select COUNT(*) from testcount

--count(*)count(索引列)是差不多的,会自动选择非聚集索引扫描

select COUNT(ProductID) from testcount

--'testcount'。扫描计数3,逻辑读取9135 次,物理读取次,预读14 次,lob 逻辑读取次,lob 物理读取次,lob 预读0次。

 

--创建聚集索引后,聚集索引扫描和全表扫描差不多

drop index testcount.testcount_pk

create clustered index testcount_pk on testcount(clusterPK)

select COUNT(*) from testcount

--'testcount'。扫描计数3,逻辑读取84541 次,物理读取1287 次,预读84311 次,lob 逻辑读取次,lob 物理读取次,lob预读次。

select COUNT(ProductID) from testcount

--'testcount'。扫描计数3,逻辑读取84541 次,物理读取1647 次,预读84098 次,lob 逻辑读取次,lob 物理读取次,lob预读次。

 

--本以为聚集索引扫描会走非叶子节点即可,结果却不是

--所以还是统计非空的非聚集索引快点










本文转自baoqiangwang51CTO博客,原文链接:http://blog.51cto.com/baoqiangwang/591289,如需转载请自行联系原作者

相关文章
|
3月前
|
SQL 算法 关系型数据库
浅析MySQL优化器统计信息
本文基于MySQL 8.0.34版本的源代码,详细介绍了MySQL中统计信息的计算和更新机制。文章首先概述了`records_per_key`统计信息在代价估计和Join Reorder算法中的重要性,接着了InnoDB统计信息的存储和计算方法,包括表级和索引级的统计信息。文章还介绍了统计信息的采样算法,特别是重要性采样在减少估计方差中的应用。此外,文章讨论了统计信息的更新时机,包括手动更新和自动更新。最后,文章简要介绍了直方图和其它统计信息,如表在内存中的占比估计,并通过实例展示了如何使用optimizer trace来分析查询优化过程。希望本文能帮助读者更好地理解MySQL的优化器。
|
4月前
|
SQL 存储 UED
系统里这个同时查冷热表的sql,动动手指,从8s降到3s
系统将交易数据按交易时间分为热表(最近3个月)和冷表(3个月前)。为保证用户体验,当企业门户端查询跨越冷热表时,尤其针对大客户,查询性能优化至关重要。以下是程序的SQL查询语句及其优化版本。
41 1
|
5月前
|
SQL 数据处理 数据库
SQL进阶之路:深入解析数据更新与删除技巧——掌握批量操作、条件筛选、子查询和事务处理,提升数据库维护效率与准确性
【8月更文挑战第31天】在数据库管理和应用开发中,数据的更新和删除至关重要,直接影响数据准确性、一致性和性能。本文通过具体案例,深入解析SQL中的高级更新(UPDATE)和删除(DELETE)技巧,包括批量更新、基于条件的删除以及使用子查询和事务处理复杂场景等,帮助读者提升数据处理能力。掌握这些技巧能够有效提高数据库性能并确保数据一致性。
104 0
|
存储
分区表和分桶表(高频重点)
分区表和分桶表(高频重点)
255 0
|
SQL 移动开发 BI
【SQL开发实战技巧】系列(二十三):数仓报表场景☞ 如何对数据排列组合去重以及通过如何找到包含最大值和最小值的记录这个问题再次用执行计划给你证明分析函数性能不一定高
怎样对数据组合重新排列并去重的问题、通过如何找到包含最大值和最小值的记录这个问题再次用执行计划给你证明分析函数性能不一定高【SQL开发实战技巧】这一系列博主当作复习旧知识来进行写作,毕竟SQL开发在数据分析场景非常重要且基础,面试也会经常问SQL开发和调优经验,相信当我写完这一系列文章,也能再有所收获,未来面对SQL面试也能游刃有余~。本篇文章主要介绍的两个方面,第一个方面曾经有好几个网友和同事问我,第二个问题真的是很多同行的通病,认为分析函数是万金油,一股脑用。
【SQL开发实战技巧】系列(二十三):数仓报表场景☞ 如何对数据排列组合去重以及通过如何找到包含最大值和最小值的记录这个问题再次用执行计划给你证明分析函数性能不一定高
【SQL开发实战技巧】系列(七):从有重复数据前提下如何比较出两个表中的差异数据及对应条数聊起
本篇文章讲解的主要内容是:***如果有重复数据如何检查出两个表中的差异数据及对应条数、表连接做聚合容易出现重复计算的错误、多表查询空值处理问题、NOT IN的子查询范围不能是空值,否则查询结果为空。***
【SQL开发实战技巧】系列(七):从有重复数据前提下如何比较出两个表中的差异数据及对应条数聊起
【SQL开发实战技巧】系列(二十五):数仓报表场景☞结果集中的重复数据只显示一次以及计算部门薪资差异高效的写法以及如何对数据进行快速分组
本篇文章讲解的主要内容是:***如何使用lag函数让结果集重复数据只显示一次、用行转列pivot写法优化部门之间计算工资差异类似需求、如何通过ceil函数对已有数据进行分组打印、放假安排团队分组值班,如何通过ntile()over(order by )快速进行人员分组***
【SQL开发实战技巧】系列(二十五):数仓报表场景☞结果集中的重复数据只显示一次以及计算部门薪资差异高效的写法以及如何对数据进行快速分组
|
关系型数据库 MySQL 开发者
索引两表优化案例|学习笔记
快速学习索引两表优化案例
114 0
索引两表优化案例|学习笔记
多表查询链接查询SQL23 统计每个学校各难度的用户平均刷题数
多表查询链接查询SQL23 统计每个学校各难度的用户平均刷题数
184 0
多表查询链接查询SQL23 统计每个学校各难度的用户平均刷题数
|
SQL 关系型数据库 MySQL
[MySQL优化案例]系列 — 索引、提交频率对InnoDB表写入速度的影响
[MySQL优化案例]系列 — 索引、提交频率对InnoDB表写入速度的影响
140 0
[MySQL优化案例]系列 — 索引、提交频率对InnoDB表写入速度的影响