Linux内存管理宏观篇(三)物理内存:物理页面

简介: Linux内存管理宏观篇(三)物理内存:物理页面

前言

关于物理内存,物理,那肯定是事物,实实在在的东西。对于这种实在的,就需要进行管理,而管理肯定是软件来管理。

对于物理内存怎么管理?

涉及到的无非就是怎么分配内存、怎么回收整理内存、怎么样提高分配效率、怎么减少浪费?

带着这几个想法,我们往下瞅瞅。

首先来看看物理页面是什么?

1、物理页面

前面我们对页这个机制有了映像,这里的物理页面就是对物理内存以页面的分配机制。现在我们都知道处理器是有个MMU硬件模块,会将虚拟内存映射到物理内存,映射的单位就是页。虚拟内存页,到物理内存页。

页面的大小常见的有4KB,但是还有8、16、64KB等。

管理内存的最小单元就是页,对于这个页面的管理,在linux中有个struct_page数据结构来描述物理页面。

来看看结构,这里将复杂的联合体暂时隐藏了。

struct page {
  unsigned long     flags;
  atomic_t        _count;
  atomic_t        _mapcount;
  unsigned long     private;
  struct address_space *mapping;
  pgoff_t         index;
  struct list_head    lru;
  void           *virtual;
}

下面来看看这些标志位代表什么?

1.1、标志 flags

flags成员是页面的标志位集合。具体定义在include/linux/page-flags.h文件中。

0 enum pageflags {
  1  PG_locked,      /* 页面已经上锁,不要访问 */
  2  PG_error, /*表示页面发生了I/O错误*/
  3  PG_referenced, /*该标志位用来实现LRU算法中的第二次机会法,详见7.6节*/
  4  PG_uptodate, /*表示页面内容是有效的,当该页面上的读操作完成后,设置该标志位*/
  5  PG_dirty, /*表示页面内容被修改过,为脏页*/
  6  PG_lru, /*表示该页在LRU链表中*/
  7  PG_active, /*表示该页在活跃LRU链表中*/
  8  PG_slab, /*表示该页属于由slab分配器创建的slab*/
  9  PG_owner_priv_1, /* 页面的所有者使用,如果是pagecache页面,文件系统可能使用*/
  10 PG_arch_1, /*与体系结构相关的页面状态位*/
  11 PG_reserved, /*表示该页不可被换出*/
  12 PG_private,/* 表示该页是有效的,当page->private包含有效值时会设置该标志位。如果页面是pagecache,那么包含一些文件系统相关的数据信息*/
  13 PG_private_2, /* 如果是pagecache, 可能包含fs aux data */
  14 PG_writeback,     /* 页面正在回写 */
  15 PG_compound,      /* 一个混合页面*/
  16 PG_swapcache,     /* 这是交换页面 */
  17 PG_mappedtodisk,   /* 在磁盘中分配了blocks */
  18 PG_reclaim,      /* 马上要被回收了 */
  19 PG_swapbacked,     /* 页面支持RAM/swap */
  20 PG_unevictable,    /* 页面是不可收回的*/
  21#ifdef CONFIG_MMU
  22 PG_mlocked,      /* vma处于mlocked状态 */
  23#endif
  24 __NR_PAGEFLAGS,
  25};

这个里面全是标志位,等到用到的时候知道在这里就行。

你是不是以为flags里面只有标志,非也非也。flags另外一个重要作用是可以存放section编号、node编号、zone编号、last_cpuid等。但是关于flags具体到底放的什么?这与内核的配置有关系,

例如 SECTION 编号和 NODE 编号与CONFIG_SPARSEMEM/CONFIG_SPARSEMEM_VMEMMAP配置相关,LAST_CPUPID与CONFIG_NUMA_BALA NCING配置相关。(这里可以看看之前我写的linux内核学习makefile和.config文件)

1.2、 _count和_mapcount 引用计数

_count:表示内核中有多少操作引用这个页面

当引用计数为0说明页面为空闲,那就说明这页面可以被释放了。
内核中常用的加减_count 引用计数的API 为 
get_page()、put_page()、page_cache_get()以及page_cache_release()函数。

_mapcount:表示页面被进程映射的次数,用户页表(pte页表),进程每个是独立的虚拟内存(3G的虚拟空间和独立页表),这就可能存在多个进程都访问一片物理页面。

_mapcount等于−1,表示没有pte映射到页面中。

_mapcount 等于 0,表示只有父进程映射了页面。匿名页面刚分配时,_mapcount引用计数初始化为0。

RMAP反向映射机制就是利用这个特性来实现的。_mapcount引用计数主要用于RMAP反向映射机制中。(通过反向看看这个物理页面还有人用吗?)RMAP就是看这个的值。

对于这两个计数值,很多内核的操作都需要这两个值,比如页面分配机制、反向映射机制、页面回收机制等,因此它是管理物理页面的核心机制。

_count和_mapcount都是atomic_t类型的变量

当需要获得_count和_mapcount的计数值,就采用内核提供的两个宏来统计某个页面的_count和_mapcount的计数。

static inline int page_mapcount(struct page *page)
static inline int page_count(struct page *page)

1.3、mapping字段

用于文件缓存(page cache) :mapping指向和相关联的address_space对象

  • address_space :内存对象(比如索引节点)的页面集合

用于匿名页面(anonymous page):mapping指向anon_vma数据结构。

  • anon_vma数据结构

1.4、lru字段

lru字段主要用在页面回收的LRU链表算法中。

LRU链表算法定义了多个链表,比如活跃链表(Active list)和非活跃链表(Inactive list)等。

在slab机制中,该字段也被用来把一个slab添加到slab满链表、slab空闲链表和slab部分满链表中。

利用这个字段将页面挂接不同链表上?

1.5、virtual字段

这个一看就知道是和虚拟内存有关系,这个是物理页面映射的虚拟内存的地址指针。

当需要动态映射这些高端内存时,字段的值才不位NULL。

当不是高端地址,我们知道物理地址和虚拟地址存在一段线性区,这里这个值就为NULL

因此可以通过这个字段判断这个页面是否是线性映射过来的。

(对于高端任然有丢丢迷惑:1GB内除了768MB的线性区,剩下到1GB的空间叫高端,还是1GB-3GB叫高端,还是两者加起来都是,这里感觉应该是后两者都合适,最后一点更符合。)

2、小结

通过上面的位我们可以得到:

得到页面状态

是否空闲页面

有多少进程在使用

谁在使用页面

页面是否被slab机制使用

这个页面是否是线性映射

我们知道很多页面的属性,但是就页面本身还是没有涉及到。

这是因为内核是给每一个页面分配了一个struct page数据结构,采用mem_map[]数组来存放,其和物理页面是一一对应。因此就不需要再在结构体里用额外的数据描述页面物理地址。(看到这个map就有一对一的感觉了撒)

struct page数据结构的mem_map[]数组定义在 mm/memory.c文件中,

它的初始化在free_area_init_node()->alloc_node_mem_map()函数中。

struct page *mem_map;
EXPORT_SYMBOL(mem_map);

每个物理页面都对应一个struct page数据结构,因此内核社区对于struct page数据结构的大小管控相当严格。

struct page 数据结构大小通常是几十字节,而一个物理页面是 4096字节,假设struct page数据结构占用40字节,那么就相当于要浪费百分之一的内存来存放这些struct page数据结构。

因此,如果在struct page数据结构新增一个变量或者指针,那么系统相当于需要额外千分之一的内存来存放这个新增的指针。假设系统是10GB内存,就要浪费10MB的内存,这种情况挺可怕的。

以上就是物理内存页,下一篇来讲讲物理内存的管理,小少爷辛苦了,休息一下吧。

参考资料:

《奔跑吧 Linux内核》

目录
相关文章
|
4月前
|
存储 监控 算法
Java内存管理深度剖析:从垃圾收集到内存泄漏的全面指南####
本文深入探讨了Java虚拟机(JVM)中的内存管理机制,特别是垃圾收集(GC)的工作原理及其调优策略。不同于传统的摘要概述,本文将通过实际案例分析,揭示内存泄漏的根源与预防措施,为开发者提供实战中的优化建议,旨在帮助读者构建高效、稳定的Java应用。 ####
74 8
|
5月前
|
缓存 算法 Java
本文聚焦于Java内存管理与调优,介绍Java内存模型、内存泄漏检测与预防、高效字符串拼接、数据结构优化及垃圾回收机制
在现代软件开发中,性能优化至关重要。本文聚焦于Java内存管理与调优,介绍Java内存模型、内存泄漏检测与预防、高效字符串拼接、数据结构优化及垃圾回收机制。通过调整垃圾回收器参数、优化堆大小与布局、使用对象池和缓存技术,开发者可显著提升应用性能和稳定性。
110 6
|
6月前
|
存储 程序员 编译器
C语言——动态内存管理与内存操作函数
C语言——动态内存管理与内存操作函数
|
6月前
|
存储 安全 程序员
【C++篇】深入内存迷宫:C/C++ 高效内存管理全揭秘
【C++篇】深入内存迷宫:C/C++ 高效内存管理全揭秘
266 3
|
6月前
|
存储 缓存 监控
深入了解MySQL内存管理:如何查看MySQL使用的内存
深入了解MySQL内存管理:如何查看MySQL使用的内存
850 1
|
7月前
|
Java
在 ArkTS 中,如何有效地进行内存管理和避免内存泄漏?
【9月更文挑战第25天】在ArkTS中,有效进行内存管理并避免内存泄漏的方法包括:及时释放不再使用的资源,如关闭监听器和清理定时器;避免循环引用,通过弱引用打破循环;合理使用单例模式,确保单例对象正确释放;及时处理不再使用的页面和组件,在卸载时清理相关资源。
281 9
|
7月前
|
监控 Java 大数据
【Java内存管理新突破】JDK 22:细粒度内存管理API,精准控制每一块内存!
【9月更文挑战第9天】虽然目前JDK 22的确切内容尚未公布,但我们可以根据Java语言的发展趋势和社区的需求,预测细粒度内存管理API可能成为未来Java内存管理领域的新突破。这套API将为开发者提供前所未有的内存控制能力,助力Java应用在更多领域发挥更大作用。我们期待JDK 22的发布,期待Java语言在内存管理领域的持续创新和发展。
|
8月前
|
存储 Java 程序员
JVM自动内存管理之运行时内存区
这篇文章详细解释了JVM运行时数据区的各个组成部分及其作用,有助于理解Java程序运行时的内存布局和管理机制。
JVM自动内存管理之运行时内存区
|
7月前
|
存储 并行计算 算法
CUDA统一内存:简化GPU编程的内存管理
在GPU编程中,内存管理是关键挑战之一。NVIDIA CUDA 6.0引入了统一内存,简化了CPU与GPU之间的数据传输。统一内存允许在单个地址空间内分配可被两者访问的内存,自动迁移数据,从而简化内存管理、提高性能并增强代码可扩展性。本文将详细介绍统一内存的工作原理、优势及其使用方法,帮助开发者更高效地开发CUDA应用程序。
|
6月前
|
Java C语言 iOS开发
MacOS环境-手写操作系统-16-内存管理 解析内存状态
MacOS环境-手写操作系统-16-内存管理 解析内存状态
80 0

热门文章

最新文章

下一篇
oss创建bucket