Linux内存管理宏观篇(三)物理内存:物理页面

简介: Linux内存管理宏观篇(三)物理内存:物理页面

前言

关于物理内存,物理,那肯定是事物,实实在在的东西。对于这种实在的,就需要进行管理,而管理肯定是软件来管理。

对于物理内存怎么管理?

涉及到的无非就是怎么分配内存、怎么回收整理内存、怎么样提高分配效率、怎么减少浪费?

带着这几个想法,我们往下瞅瞅。

首先来看看物理页面是什么?

1、物理页面

前面我们对页这个机制有了映像,这里的物理页面就是对物理内存以页面的分配机制。现在我们都知道处理器是有个MMU硬件模块,会将虚拟内存映射到物理内存,映射的单位就是页。虚拟内存页,到物理内存页。

页面的大小常见的有4KB,但是还有8、16、64KB等。

管理内存的最小单元就是页,对于这个页面的管理,在linux中有个struct_page数据结构来描述物理页面。

来看看结构,这里将复杂的联合体暂时隐藏了。

struct page {
  unsigned long     flags;
  atomic_t        _count;
  atomic_t        _mapcount;
  unsigned long     private;
  struct address_space *mapping;
  pgoff_t         index;
  struct list_head    lru;
  void           *virtual;
}

下面来看看这些标志位代表什么?

1.1、标志 flags

flags成员是页面的标志位集合。具体定义在include/linux/page-flags.h文件中。

0 enum pageflags {
  1  PG_locked,      /* 页面已经上锁,不要访问 */
  2  PG_error, /*表示页面发生了I/O错误*/
  3  PG_referenced, /*该标志位用来实现LRU算法中的第二次机会法,详见7.6节*/
  4  PG_uptodate, /*表示页面内容是有效的,当该页面上的读操作完成后,设置该标志位*/
  5  PG_dirty, /*表示页面内容被修改过,为脏页*/
  6  PG_lru, /*表示该页在LRU链表中*/
  7  PG_active, /*表示该页在活跃LRU链表中*/
  8  PG_slab, /*表示该页属于由slab分配器创建的slab*/
  9  PG_owner_priv_1, /* 页面的所有者使用,如果是pagecache页面,文件系统可能使用*/
  10 PG_arch_1, /*与体系结构相关的页面状态位*/
  11 PG_reserved, /*表示该页不可被换出*/
  12 PG_private,/* 表示该页是有效的,当page->private包含有效值时会设置该标志位。如果页面是pagecache,那么包含一些文件系统相关的数据信息*/
  13 PG_private_2, /* 如果是pagecache, 可能包含fs aux data */
  14 PG_writeback,     /* 页面正在回写 */
  15 PG_compound,      /* 一个混合页面*/
  16 PG_swapcache,     /* 这是交换页面 */
  17 PG_mappedtodisk,   /* 在磁盘中分配了blocks */
  18 PG_reclaim,      /* 马上要被回收了 */
  19 PG_swapbacked,     /* 页面支持RAM/swap */
  20 PG_unevictable,    /* 页面是不可收回的*/
  21#ifdef CONFIG_MMU
  22 PG_mlocked,      /* vma处于mlocked状态 */
  23#endif
  24 __NR_PAGEFLAGS,
  25};

这个里面全是标志位,等到用到的时候知道在这里就行。

你是不是以为flags里面只有标志,非也非也。flags另外一个重要作用是可以存放section编号、node编号、zone编号、last_cpuid等。但是关于flags具体到底放的什么?这与内核的配置有关系,

例如 SECTION 编号和 NODE 编号与CONFIG_SPARSEMEM/CONFIG_SPARSEMEM_VMEMMAP配置相关,LAST_CPUPID与CONFIG_NUMA_BALA NCING配置相关。(这里可以看看之前我写的linux内核学习makefile和.config文件)

1.2、 _count和_mapcount 引用计数

_count:表示内核中有多少操作引用这个页面

当引用计数为0说明页面为空闲,那就说明这页面可以被释放了。
内核中常用的加减_count 引用计数的API 为 
get_page()、put_page()、page_cache_get()以及page_cache_release()函数。

_mapcount:表示页面被进程映射的次数,用户页表(pte页表),进程每个是独立的虚拟内存(3G的虚拟空间和独立页表),这就可能存在多个进程都访问一片物理页面。

_mapcount等于−1,表示没有pte映射到页面中。

_mapcount 等于 0,表示只有父进程映射了页面。匿名页面刚分配时,_mapcount引用计数初始化为0。

RMAP反向映射机制就是利用这个特性来实现的。_mapcount引用计数主要用于RMAP反向映射机制中。(通过反向看看这个物理页面还有人用吗?)RMAP就是看这个的值。

对于这两个计数值,很多内核的操作都需要这两个值,比如页面分配机制、反向映射机制、页面回收机制等,因此它是管理物理页面的核心机制。

_count和_mapcount都是atomic_t类型的变量

当需要获得_count和_mapcount的计数值,就采用内核提供的两个宏来统计某个页面的_count和_mapcount的计数。

static inline int page_mapcount(struct page *page)
static inline int page_count(struct page *page)

1.3、mapping字段

用于文件缓存(page cache) :mapping指向和相关联的address_space对象

  • address_space :内存对象(比如索引节点)的页面集合

用于匿名页面(anonymous page):mapping指向anon_vma数据结构。

  • anon_vma数据结构

1.4、lru字段

lru字段主要用在页面回收的LRU链表算法中。

LRU链表算法定义了多个链表,比如活跃链表(Active list)和非活跃链表(Inactive list)等。

在slab机制中,该字段也被用来把一个slab添加到slab满链表、slab空闲链表和slab部分满链表中。

利用这个字段将页面挂接不同链表上?

1.5、virtual字段

这个一看就知道是和虚拟内存有关系,这个是物理页面映射的虚拟内存的地址指针。

当需要动态映射这些高端内存时,字段的值才不位NULL。

当不是高端地址,我们知道物理地址和虚拟地址存在一段线性区,这里这个值就为NULL

因此可以通过这个字段判断这个页面是否是线性映射过来的。

(对于高端任然有丢丢迷惑:1GB内除了768MB的线性区,剩下到1GB的空间叫高端,还是1GB-3GB叫高端,还是两者加起来都是,这里感觉应该是后两者都合适,最后一点更符合。)

2、小结

通过上面的位我们可以得到:

得到页面状态

是否空闲页面

有多少进程在使用

谁在使用页面

页面是否被slab机制使用

这个页面是否是线性映射

我们知道很多页面的属性,但是就页面本身还是没有涉及到。

这是因为内核是给每一个页面分配了一个struct page数据结构,采用mem_map[]数组来存放,其和物理页面是一一对应。因此就不需要再在结构体里用额外的数据描述页面物理地址。(看到这个map就有一对一的感觉了撒)

struct page数据结构的mem_map[]数组定义在 mm/memory.c文件中,

它的初始化在free_area_init_node()->alloc_node_mem_map()函数中。

struct page *mem_map;
EXPORT_SYMBOL(mem_map);

每个物理页面都对应一个struct page数据结构,因此内核社区对于struct page数据结构的大小管控相当严格。

struct page 数据结构大小通常是几十字节,而一个物理页面是 4096字节,假设struct page数据结构占用40字节,那么就相当于要浪费百分之一的内存来存放这些struct page数据结构。

因此,如果在struct page数据结构新增一个变量或者指针,那么系统相当于需要额外千分之一的内存来存放这个新增的指针。假设系统是10GB内存,就要浪费10MB的内存,这种情况挺可怕的。

以上就是物理内存页,下一篇来讲讲物理内存的管理,小少爷辛苦了,休息一下吧。

参考资料:

《奔跑吧 Linux内核》

目录
相关文章
|
12天前
|
缓存 算法 Java
本文聚焦于Java内存管理与调优,介绍Java内存模型、内存泄漏检测与预防、高效字符串拼接、数据结构优化及垃圾回收机制
在现代软件开发中,性能优化至关重要。本文聚焦于Java内存管理与调优,介绍Java内存模型、内存泄漏检测与预防、高效字符串拼接、数据结构优化及垃圾回收机制。通过调整垃圾回收器参数、优化堆大小与布局、使用对象池和缓存技术,开发者可显著提升应用性能和稳定性。
33 6
|
14天前
|
算法 Linux 开发者
深入探究Linux内核中的内存管理机制
本文旨在对Linux操作系统的内存管理机制进行深入分析,探讨其如何通过高效的内存分配和回收策略来优化系统性能。文章将详细介绍Linux内核中内存管理的关键技术点,包括物理内存与虚拟内存的映射、页面置换算法、以及内存碎片的处理方法等。通过对这些技术点的解析,本文旨在为读者提供一个清晰的Linux内存管理框架,帮助理解其在现代计算环境中的重要性和应用。
|
16天前
|
算法
虚拟内存的页面置换算法有哪些?
【10月更文挑战第25天】不同的页面置换算法各有优缺点,在实际应用中,操作系统会根据不同的应用场景和系统需求选择合适的页面置换算法,或者对算法进行适当的改进和优化,以平衡系统的性能、开销和资源利用率等因素。
36 5
|
20天前
|
存储 缓存 监控
|
1月前
|
存储 缓存 监控
Linux中内存和性能问题
【10月更文挑战第5天】
38 4
|
1月前
|
算法 Linux
Linux中内存问题
【10月更文挑战第6天】
42 2
|
17天前
|
缓存 算法 Linux
Linux内核中的内存管理机制深度剖析####
【10月更文挑战第28天】 本文深入探讨了Linux操作系统的心脏——内核,聚焦其内存管理机制的奥秘。不同于传统摘要的概述方式,本文将以一次虚拟的内存分配请求为引子,逐步揭开Linux如何高效、安全地管理着从微小嵌入式设备到庞大数据中心数以千计程序的内存需求。通过这段旅程,读者将直观感受到Linux内存管理的精妙设计与强大能力,以及它是如何在复杂多变的环境中保持系统稳定与性能优化的。 ####
24 0
|
1月前
|
存储 缓存 固态存储
|
1月前
|
存储 程序员 编译器
C语言——动态内存管理与内存操作函数
C语言——动态内存管理与内存操作函数
|
1月前
|
存储 缓存 监控
深入了解MySQL内存管理:如何查看MySQL使用的内存
深入了解MySQL内存管理:如何查看MySQL使用的内存
315 1