性能优化特性之：TLBI - TLB range优化

2023-08-04 1170

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

云数据库 RDS MySQL，集群系列 2核4GB

RDS MySQL Serverless 基础系列，0.5-2RCU 50GB

EMR Serverless StarRocks，5000CU*H 48000GB*H

简介： 本文介绍了倚天实例上的内存优化特性：TLBi，并从优化原理、使用方法进行详细阐述。

优化原理

TLB flush range是arm64芯片在armv8.4-TLBI版本上支持的一种指令集批量处理地址刷新的特性，需要内核配置文件开启CONFIG_ARM64_TLB_RANGE功能，此外还需要arm64芯片支持armv8.4-TLBI特性。传统的TLB flush操作方式，以stride为粒度去进行TLB flush, 这种方式存在明显弊端，对于需要刷新大量的地址范围，需要将其拆分为一个个stride粒度去进行刷新，导致耗时较多。TLB flush range的意义在于动态切割地址范围，按照如下设计思想: 每一次刷新页数目由numa和scale两个变量决定，num值方位为（-1， 31），通过__TLBI_RANGE_NUM传入的剩余需要刷新的pages数以及scale的值获得num具体的值，当num=-1时，表示刷新完成。

#define TLBI_RANGE_MASK                 GENMASK_ULL(4, 0)
#define __TLBI_RANGE_NUM(pages, scale)  \
          ((((pages) >> (5 * (scale) + 1)) & TLBI_RANGE_MASK) - 1)

scale的值按照0逐渐递增，结合num值，统计出此次刷新的页数。

#define __TLBI_RANGE_PAGES(num, scale)   \
                  ((unsigned long)((num) + 1) << (5 * (scale) + 1))

按照rvale1is格式，将地址start, 以及scale和num值，写入rvale1is寄存器中，对页进行刷新操作。

__TLBI_VADDR_RANGE(start, asid, scale, num, tlb_level);
__tlbi(rvale1is, addr);
__tlbi_user(rvale1is, addr);

使用方法

使用Alinux3.2208及以后版本

Alinux3在2208版本（内核版本5.10.134-12_rc1）已默认启用该特性

---------------------------------------------------------------------------------------

更多调优信息，请参考：

龙蜥社区：https://openanolis.cn/

KeenTune SIG：https://openanolis.cn/sig/KeenTune

阿里云龙蜥操作系统专区：https://developer.aliyun.com/group/aliyun_linux

文章标签：

芯片

Anolis

性能优化特性之：TLBI - TLB range优化

优化原理

使用方法

使用Alinux3.2208及以后版本

倚天

热门文章

最新文章

相关电子书