开发者社区> 问答> 正文

OceanBase数据库低基数列 12万相对全表1.2亿,表现出来查询慢,有啥方式可以优化吗 ?

OceanBase数据库低基数列 12万相对全表1.2亿,表现出来查询慢,有啥方式可以优化吗 ?

展开
收起
真的很搞笑 2023-12-24 18:42:43 228 0
来自:OceanBase
5 条回答
写回答
取消 提交回答
  • 当OceanBase数据库中存在低基数列查询慢的情况时,针对12万种不同的值相对于全表1.2亿行数据的比例较小,可以从多个角度来优化查询性能:

    1. 索引优化:

      • 合适索引:检查是否在查询中涉及的低基数列上创建了合适的索引,特别是B树索引。如果查询经常基于这个列进行范围查询或者等值查询,合理索引可以帮助提高查询效率。
      • 组合索引:考虑创建包含低基数列和其他频繁出现在WHERE条件中的列的组合索引,以提升索引的选择性和利用率。
    2. 查询优化:

      • 查询条件优化:尽可能地细化查询条件,缩小数据范围,避免全表扫描或大量无效的索引扫描。
      • 避免全表扫描:除非必要,否则不要在查询中使用全表扫描,尤其是当只需要少量满足条件的数据时。
      • 避免排序与临时表:若查询中存在不必要的排序或中间结果需要存放在临时表中,考虑修改查询逻辑,减少排序开销或避免使用临时表。
    3. 分区策略:

      • 分区表:将大表分为多个分区,可以根据低基数列进行范围分区或列表分区,这样可以减少查询时需要扫描的数据量。
    4. 资源调优:

      • 资源配置:检查OceanBase集群的资源配置,如存储资源、计算资源是否充足,适当增加资源分配有助于提高查询性能。
    5. 查询优化器调整:

      • 查询提示:如有必要,可以使用查询提示来指导OceanBase查询优化器选择正确的执行计划。
      • 统计信息更新:确保统计信息是最新的,以便优化器做出更为精准的成本估算。
    6. 硬件与集群扩容:

      • SSD存储:使用高速存储介质,如SSD,加快I/O速度。
      • 分布式集群优化:根据负载均衡原则,优化数据分布和并发查询能力。
    7. 缓存机制:

      • 利用数据库内部缓存:OceanBase数据库内部可能有自己的缓存机制,确保缓存命中率高,尤其对热点数据。
      • 应用层缓存:在应用程序层面加入缓存策略,将高频查询结果缓存起来,减少对数据库的直接访问。

    务必结合实际业务场景和数据库的具体配置进行细致分析,使用OceanBase自带的性能分析工具(如EXPLAIN PLAN)查看查询执行计划,理解为何查询未有效利用索引,并据此制定针对性优化措施。同时,定期关注数据库性能监控指标,持续优化数据库架构与SQL语句。

    2024-01-10 16:01:53
    赞同 展开评论 打赏
  • 十分耕耘,一定会有一分收获!

    楼主你好,对于阿里云OceanBase数据库中的低基数列(即唯一值很少的列),可以采用建立索引,对于低基数列,可以考虑对其建立索引,索引可以大大提高查询效率。使用CREATE INDEX命令创建合适的索引,可以根据查询需求选择适合的索引类型,如B树索引、哈希索引等。

    还可以使用覆盖索引,如果查询中只需要访问低基数列,可以考虑建立覆盖索引,覆盖索引会将所需的列直接存储在索引中,避免了查询过程中的额外IO操作,提高查询效率。

    2024-01-03 20:04:17
    赞同 展开评论 打赏
  • 慢SQL千千万,应该优先处理哪些SQL是摆在面前的第一个问题,OB的审计日志给我们提供了具体的线索,可以通过以下SQL来判断哪些SQL总体执行耗时更长。

    select
                    tenant_name,
                    database_name as db_name,
                    sql_id,
                    substr(replace(statement, '\n', ' '), 1, 100) as statement,
                    svr_ip,
                    type,
                    executions as executions,
                    avg_exe_usec as avg_exe_usec,
                    (avg_exe_usec * executions) as total_exe_usec,
                    elapsed_time,
                    slowest_exe_usec,
                    slow_count,
                    hit_count,
                    large_querys,
                    rows_processed
            from
                    __all_virtual_plan_stat a
                    inner join __all_virtual_database b on a.db_id = b.database_id
                    inner join __all_tenant c on a.tenant_id = c.tenant_id
            where
                    c.tenant_id > 1000
            order by
                    total_exe_usec desc,
                    a.tenant_id
            limit
                    10;
    

    Top 1的SQL优化完了之后下一轮收集__all_virtual_sql_audit时虽然其他SQL又会冒出来,但是我们已经把控住了优化的节奏:

    1)每次只用关注Top 10的SQL,将精力集中在解决这10条SQL上,不断迭代,性能稳步提升;

    2)把握住核心原则,建议每条SQL都携带分区键作为过滤条件之一,如果确实部分SQL无法携带分区键,则可以尝试通过全局索引来提升性能;

    ——更多的优化方式请参考链接

    2024-01-03 17:49:48
    赞同 1 展开评论 打赏
  • 天下风云出我辈,一入江湖岁月催,皇图霸业谈笑中,不胜人生一场醉。

    索引优化:检查查询语句中使用的列是否需要索引,并根据查询频率和数据量等因素,合理创建索引。可以使用阿里云的诊断系统查询诊断系统判定认为可能存在性能问题的SQL,并根据诊断结果进行优化。
    数据分区:如果数据量较大,可以考虑将数据进行分区存储,根据查询需求进行分区检索,从而提高查询效率。
    缓存优化:可以使用阿里云的缓存服务(如Memcached、Redis等)来缓存查询结果,从而避免频繁的数据库查询。
    分布式部署:如果数据量较大,可以考虑将数据库进行分布式部署,将查询负载均衡分配到多个节点上,从而提高查询效率。
    数据库优化:对数据库进行优化,如优化查询语句、合理设计数据库结构等,也可以提高查询效率。

    2023-12-29 12:14:10
    赞同 展开评论 打赏
  • 北京阿里云ACE会长

    针对OceanBase数据库低基数列查询慢的问题,可以尝试以下几种优化方式:

    1. 使用索引:为低基数列创建索引,可以大幅提高查询速度。创建索引时,可以考虑使用覆盖索引,将查询条件中的列添加到索引中,这样在查询时,数据库可以只扫描索引,而不需要访问数据表,从而提高查询效率。
    2. 分区表:根据业务需求和数据特点,将数据表进行分区,将低基数的列作为分区键。这样在查询时,数据库只需要扫描相关的分区,而不是全表扫描,从而提高查询速度。
    3. 数据压缩:针对低基数列的数据特点,可以考虑对数据进行压缩。压缩后的数据可以减少磁盘空间占用,同时提高查询速度。OceanBase支持多种压缩算法,可以根据实际需求选择合适的压缩方式。
    4. 查询优化:在编写查询语句时,尽量减少查询范围,只查询需要的数据。同时,避免在查询时使用函数或复杂计算,这些操作会导致数据库无法使用索引,从而降低查询效率。
    5. 数据库调优:根据系统性能情况,可以对OceanBase数据库进行调优,例如调整缓存大小、连接数等参数,以提高系统性能。
    6. 使用分布式数据库:如果单个数据库实例无法满足性能需求,可以考虑使用分布式数据库。OceanBase支持分布式部署,可以通过横向扩展,提高系统处理能力。
    2023-12-27 21:02:11
    赞同 展开评论 打赏
来源圈子
更多
收录在圈子:
+ 订阅
蚂蚁OceanBase数据库团队,用于OceanBase技术原理、运维经验和案例分享、对外交流。
问答排行榜
最热
最新

相关电子书

更多
DTCC 2022大会集锦《云原生一站式数据库技术与实践》 立即下载
阿里云瑶池数据库精要2022版 立即下载
2022 DTCC-阿里云一站式数据库上云最佳实践 立即下载