在PolarDB索引的cardinality都是 11117 为什么join 评估的行数只有 285?
在数据库优化器中,JOIN操作的成本估算和执行计划生成是非常复杂的,涉及到多个因素,包括但不限于索引的选择性(Cardinality)、表的实际数据分布、统计信息的准确性、JOIN条件的筛选力度、数据冗余、查询过滤条件、JOIN类型(如Nested Loop Join、Hash Join、Merge Join等)等因素。
尽管索引的Cardinality(基数)表示的是索引列中不重复值的数量,但它只是估计行数的一个依据,而非精确的行数。在JOIN操作中,特别是当JOIN条件不仅仅是基于索引列时,优化器还会综合考虑JOIN条件带来的过滤效果,即通过JOIN条件能匹配多少行。
假设PolarDB数据库中,即使两张表参与JOIN的索引Cardinality均为11117,但在JOIN条件的作用下,可能只有部分行才能相互匹配。也就是说,实际执行JOIN操作时,可能只有285行符合JOIN条件的要求。数据库优化器正是基于现有的统计信息和JOIN条件做出这一估算,以制定最优的执行计划。
如果在具体场景中遇到这种情况,建议通过以下方式进行排查和优化:
EXPLAIN
或ANALYZE
等工具查看优化器如何估算JOIN成本,并查看执行计划详情。在数据库中,索引的基数(Cardinality)代表的是索引的唯一值数量。而Join评估的行数则是Join算子输出的中间结果集的大小,它是由所有Join Reorder算法进行顺序选择的重要依据。所以,如果Join评估的行数比索引的基数小,可能的原因有:
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
PolarDB 分布式版 (PolarDB for Xscale,简称“PolarDB-X”) 采用 Shared-nothing 与存储计算分离架构,支持水平扩展、分布式事务、混合负载等能力,100%兼容MySQL。 2021年开源,开源历程及更多信息访问:OpenPolarDB.com/about