hit 命中率的解释

本文涉及的产品
全局流量管理 GTM,标准版 1个月
日志服务 SLS,月写入数据量 50GB 1个月
云解析 DNS,旗舰版 1个月
简介: 1、 Buffer NoWait这个指标是指在缓冲区获取buffer的未等待比率正常指标范围: Buffer Nowait率正常指标范围为:99%-100%计算公式: Buffer Nowait = (1- buffer busy wait / session...

1、 Buffer NoWait

这个指标是指在缓冲区获取buffer的未等待比率
正常指标范围:
 Buffer Nowait率正常指标范围为:99%-100%
计算公式:
 Buffer Nowait = (1- buffer busy wait / session logical reads) * 100

可以通过SQL查询得到Buffer NoWait命中率
select round((1 - busy.value/tol.value)*100,2) "Buffer busy NoWait Ratio"
from (select sum(count) value from v$waitstat 
where class in ('data block','segment header','undo header','undo block')) busy,
      (select value from v$sysstat 
       where name='session logical reads') tol;

影响因素:
1. db_block_buffers或db_cache_size等参数
2. 增加表的Freelist参数
3. 使用Automatic Segment Storge Management(ASSM)来创建表空间
4. 优化程序使用的SQL语句



2 BUFFER hit命中率

也就是通常所说高速缓存的命中率,这个指标是指通过内存得到访问的数据和所有访问的数据之间的一个比例
正常指标范围:

    Buffer命中率正常的指标为:90%-100%,但在 数据库 繁忙运行期间(批处理应用、数据仓库),Buffer命中率可能低于90%,这是正常的指标。
计算公式:
   Buffer hit =(1-physical reads cache /(consistent gets from cache + db block gets from cache)) *100
其中:
 physical reads cache = physical reads - physical reads direct -  physical read direct(LOB)
 consistent gets from cache = consistent gets
 db block gets from cache = db block gets

可以通过SQL查询数所库性能字典得到数据库高速缓存的命中率
select round((1 - (physical.value - direct.value - lobs.value)/logical.value)*100,2) "Buffer Cache Hit Ratio"
from v$sysstat physical,v$sysstat direct,v$sysstat lobs,v$sysstat logical
where physical.name ='physical reads'
  and direct.name ='physical reads direct'
  and lobs.name ='physical reads direct (lob)'
  and logical.name ='session logical reads';

影响因素:
1. Buffer 命中率受Oracle SGA中的data block buffers参数的设置影响
2. 跟oracle buffer Pool的使用方法有关
3. 把经常使用的小表cache在内存中
4. 调优SQL语句,以养活少访问的数据量



3 LIBRARY hit 命中率
就是通常所说的库缓存的命中率。指的是在Oracle执行SQL语句的过程中,通过内存直接得到对象的命名空间。
正常指标范围:
Library命中率正常指标范围为:95%-100%
计算公式:
 Library hit = sum(pins)/(sum(pins)+sum(reloads)) *100

可以通过SQL查询得到库缓存的命中率
select round(sum(pins -reloads)/sum(pins)*100,2) "Library Cache Hit Ratio"
from v$librarycache;

影响因素:
1. Library命中率受Oracle SGA中的shared pool参数设置影响
2. 跟应用软件的开发有密切的关系,特别是共享SQL的使用



4 Execute to Parse
这个指标是指数据库的SQL语句执行和分析的比例,如果要SQL重用率高,则这个比例会很高。该值越高表示一次解析后被重复执行的次数越多。
正常指标范围:
 Execute to Parse 越接近高(接近100%)越好,但是一般
计算公式:
 Execute to Parse = (1- Parses / Executions) * 100


可以通过SQL查询得到Execute to Parse率
select round((1 - hard.value/total.value)*100,2) "Execute to Parse Ratio"
from v$sysstat hard,v$sysstat total
where hard.name ='parse count (hard)'
and total.name ='parse count (total)';

影响因素:
1. Share_pool_size参数的大小
2. 最重要的影响因素是应用程是否使用了绑定变量


如果系统Parses > Executions,就可能出现该比率小于0的情况。该值<0通常说明shared pool设置或者语句效率存在问题,造成反复解析,reparse可能较严重,或者是可能同snapshot有关,通常说明数据库性能存在问题

a、Execute to Parse%是执行到解析的度量,最佳情况下,是一次解析多次执行,最佳的是使用软软解析; 
b、涉及到的参数主要是OPEN_CURSORS与session_cached_cursors,前者定义单个session可以打开游标数,后者定义游标可缓存长度 
c、通常情况下上述两个参数的使用率应尽可能偏离80%,以确保性能及资源充足,注意,这2个参数增大应考虑是否pga以及sga需要进一步调整



Execute to Parse,不是硬、软解析的问题,也不是软软解析的问题,是执行和解析的问题。一次解析多次执行,无解析,才会使这个指标更好。
SQL的执行,不是有如下几个步骤吗:打开、解析、绑定、执行、抓取、关闭。
解析的时候确定执行计划,硬解析就是重新生成执行,软解析是在共享池中找到了执行计划,软软解析是让查找执行计划的过程更短、更快。但无论软解析、还是软软解析,都有解析这个操作。无解析就是不再解析,为SQL绑定不同的变量,然后执行。这样做的前提就是:1、Session不能断开,2、Session执行过解析过的SQL不要关闭。满足这两点就可以了。




5 Parse CPU to Pares Elapsed
解析实际运行时间/(解析实际运行时间+解析中等待资源时间),越高越好。计算公式为:Parse CPU to Parse Elapsd %= 100*(parse time cpu / parse time elapsed)。即:解析实际运行时间/(解析实际运行时间+解析中等待资源时间)。如果该比率为100%,意味着CPU等待时间为0,没有任何等待。
正常指标范围:
 Parse CPU to Parse Elapsed  越接近100%越好
计算公式:
 Parse CPU to Parse Elapsed =(1-Parses time cpu/Parses time elapsed)* 100

可以通过SQL查询得到Parse CPU to Parse Elapsed e率
select round((1 - cpu.value/total.value)*100,2) "Parse CPU to Parse Elapsed Ratio"
from v$sysstat cpu,v$sysstat total
where cpu.name ='parse time cpu'
and total.name ='parse time elapsed';
影响因素:
1. 如果这个比例很低,说明分析过程中CPU等待了其它的资源


-------------------------------------------------------------


6 Redo NoWait
这个指标是指redo缓冲区获取buffer的未等待比率
正常指标范围:
Redo Nowait率正常指标范围为:99%-100%
计算公式:
Redo Nowait = (1- redo log space requests / reso entries) * 100

可以通过SQL查询得到Redo NoWait命中率
select round((1 - waits.value/redos.value)*100,2) "Redo NoWait Ratio"
from v$sysstat waits,v$sysstat redos
where waits.name ='redo log space requests'
  and redos.name ='redo entries';

影响因素:
1. Log_buffer_size参数设置过小
2. 归档的速度太慢
3. 联机日志文件太小
4. 联机日志文件放在缓慢的磁盘设备上



7  In-Memory Sort命中率
这个指标是指在内存中完成的排序和硬盘上排序的比率
正常指标范围:
 In-Memory Sort命中率正常指标范围为:99%-100%
计算公式:
 In-Memory Sort hit= (1 -sorts(disk)/(sorts(disk)+sorts(memory))) * 100

可以通过SQL查询得到In-Memory Sort命中率
select round((1 - disk.value/(disk.value + memory.value))*100,2) "In-Memory Sort"
from v$sysstat disk,v$sysstat memory
where disk.name ='sorts (disk)'
and memory.name ='sorts (memory)';

影响因素:
1. 数据库参数sort_area_size或pga_aggregate_target的大小
2. 应用程序的SQL语句的写法



8 Soft Parse 

软解析比例,无需多说的经典指标,数据来源v$sysstat statistics的parse count(total)和parse count(hard)。 合理值>95%

Soft Parse %是AWR中另一个重要的解析指标,该指标反应了快照时间内 软解析次数 和 总解析次数 (soft+hard 软解析次数+硬解析次数)的比值,若该指标很低,那么说明了可能存在剧烈的hard parse硬解析,大量的硬解析会消耗更多的CPU时间片并产生解析争用(此时可以考虑使用cursor_sharing=FORCE); 理论上我们总是希望 Soft Parse % 接近于100%, 但并不是说100%的软解析就是最理想的解析状态,通过设置 session_cached_cursors参数和反复重用游标我们可以让解析来的更轻量级,即通俗所说的利用会话缓存游标实现的软软解析(soft soft parse)。



9 LATCH hit 命中率
Latch是一种简单的低级串行化机制,用于保护系统全局区中的共享 数据结构 。如:保护当前正在止访问数据库的用户列表,保护描述缓冲区中的块的数据结构。对于服务器或后台进程来说,必须取得伴随的LATCH才能开始操作或查看共享的数据结构,而在完成后,又必须释放伴随的LATCH,LATCH的实施和 操作系统 的平台有关,尤其与进程是否需要等待LATCH以及需要等待多长时间有关。
正常指标范围:
LATCH命中率正常指标范围为:99%-100%
计算公式:
 Latch hit = (1 - sum(misses + immediate_misses)/sum(gets+immediate_gets) ) * 100

可以通过SQL查询得到LATCH命中率
select round((1-sum(misses +immediate_misses)/sum(gets + immediate_gets))*100,2) "Latch Hit Ratio"
from v$latch;

影响因素:
1. 应用程序SQL是否使用绑定变量
2. Shared_pool_size参数的设置



10 Non-Parse CPU
这个指标是指数据库用在非分析的过程中CPU的等待了其它的资源
正常指标范围:
Non-Parse CPU越接近100%越好
计算公式:
Non-Parse CPU = (1- parse time cpu / CPU used by this session) * 100

可以通过SQL查询得到Non-Parse CPU率
select round((1 - parse.value/total.value)*100,2) "Non-Parse CPU Ratio"
from v$sysstat parse,v$sysstat total
where parse.name ='parse time cpu'
and total.name ='CPU used by this session'

影响因素:
1. 如果这个比例很低,说明CPU用在分析SQL语句上面消耗了很多CPU时间,可能是没有用绑定变量
















10 Rollback segment竟争情况
这个是指等待rollback segment的header比率
正常指标范围:
rollback segment等待率比率越小越好
计算公式:
rollback segment = (waits/gets) * 100

可以通过SQL查询得到rollback segment等待率
select name,waits,gets,round(waits/gets*100,2) "Ratio"
from v$rollstat a,v$rollname b
where a.usn = b.usn;

影响因素:
1. 回滚段竟争情况受回滚段size的设置影响
2. 跟应用软件的有关,特别是long runnig time transaction的使用

11 Tablespace的I/O比例
这个是指表空间的所使用的I/O比例
正常指标范围:
Tablespace I/O越小越好
计算公式:

可以通过SQL查询得到Tablespace I/O情况
select df.tablespace_name,sum(f.phyrds),sum(f.phyblkrd),
sum(f.phywrts),sum(f.phyblkwrt)
from v$filestat f,dba_data_files df
where f.file#=df.file_id
group by df.tablespace_name
order by df.tablespace_name;

影响因素:
1. Tablespace的I/O情况受db_block_size参数的设置影响
2. 跟数据文件的磁盘分布有密切关系

12 Datafile 的I/O比例
这个是指访问数据文件所使用的I/O比例
正常指标范围:
Datafile I/O越小越好
计算公式:

可以通过SQL查询得到Datafile I/O情况
select df.name,sum(f.phyrds),sum(f.phyblkrd),sum(f.phywrts),sum(f.phyblkwrt)
from v$filestat f,v$datafile df
where f.file#=df.file#
group by df.name
order by df.name;

影响因素:
1. Datafile的I/O情况受db_block_size参数的设置影响
2. 跟数据文件的磁盘分布有密切关系

13 重做日志缓存区命中率
这个是指重做日志缓存区的命中率
正常指标范围:
重做日志缓存区的命中率越大越好,应大于90%
计算公式:

可以通过SQL查询得到日志缓存区的命中率
select name,gets,misses,immediate_gets,immediate_misses,
100 - round(decode(gets,0,0,misses/gets *100),2) ratio1,
100 - round(decode(immediate_gets+immediate_misses,0,0,immediate_misses/
(immediate_gets+immediate_misses)*100),2) ratio2
from v$latch
where name in ('redo allocation','redo copy');
影响因素:
1. 受log_buffer_size设置影响
2. 跟应用软件的有关,特别是共享SQL的使用

14 碎片程度
这个是指数据库中自由空间碎片FSFI--Free Space Fragmentation Index (自由空间碎片索引)值来直观体现
正常指标范围:
FSFI越大越好,应大于30%
计算公式:
 FSFI=100*SQRT(max(extent)/sum(extents))*1/SQRT(SQRT(count(extents)))

可以通过SQL查询得到日志缓存区的命中率
select tablespace_name,sqrt(max(blocks)/sum(blocks))* (100/sqrt(sqrt(count(blocks)))) FSFI 
from dba_free_space 
group by tablespace_name order by 1tablespace_name;
影响因素:
1. 碎片情况受db_block_size,segment_size的设置影响
2. 跟数据块设置大小,段的设置大小有密切的关系




相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
5月前
|
存储 缓存 算法
缓存优化利器:5分钟实现 LRU Cache,从原理到代码!
嗨,大家好!我是你们的技术小伙伴——小米。今天带大家深入了解并手写一个实用的LRU Cache(最近最少使用缓存)。LRU Cache是一种高效的数据淘汰策略,在内存有限的情况下特别有用。本文将从原理讲起,带你一步步用Java实现一个简单的LRU Cache,并探讨其在真实场景中的应用与优化方案,如线程安全、缓存持久化等。无论你是初学者还是有一定经验的开发者,都能从中受益。让我们一起动手,探索LRU Cache的魅力吧!别忘了点赞、转发和收藏哦~
120 2
|
缓存 编译器 C++
C/C++性能提升之cache分析
C/C++性能提升之cache分析
353 0
|
机器学习/深度学习 存储 SQL
别再用 offset 和 limit 分页了,性能太差
别再用 offset 和 limit 分页了,性能太差
1527 0
别再用 offset 和 limit 分页了,性能太差
|
存储 缓存 算法
从 LRU Cache 带你看面试的本质
在讲这道题之前,我想先聊聊「技术面试究竟是在考什么」这个问题。
227 0
从 LRU Cache 带你看面试的本质
实验2 使用 LRU 方法更新 Cache
了解和掌握寄存器分配和内存分配的有关技术。
实验2 使用 LRU 方法更新 Cache
|
SQL 索引 关系型数据库
生产 latch: cache buffers chains等待事件分析
生产 latch: cache buffers chains等待事件分析 一,表面现象:某库CPU冲高,大量latch: cache buffers chains等待事件。
1140 0