Linux内存管理宏观篇(三)物理内存:物理页面

简介: Linux内存管理宏观篇(三)物理内存:物理页面

前言

关于物理内存,物理,那肯定是事物,实实在在的东西。对于这种实在的,就需要进行管理,而管理肯定是软件来管理。

对于物理内存怎么管理?

涉及到的无非就是怎么分配内存、怎么回收整理内存、怎么样提高分配效率、怎么减少浪费?

带着这几个想法,我们往下瞅瞅。

首先来看看物理页面是什么?

1、物理页面

前面我们对页这个机制有了映像,这里的物理页面就是对物理内存以页面的分配机制。现在我们都知道处理器是有个MMU硬件模块,会将虚拟内存映射到物理内存,映射的单位就是页。虚拟内存页,到物理内存页。

页面的大小常见的有4KB,但是还有8、16、64KB等。

管理内存的最小单元就是页,对于这个页面的管理,在linux中有个struct_page数据结构来描述物理页面。

来看看结构,这里将复杂的联合体暂时隐藏了。

struct page {
  unsigned long     flags;
  atomic_t        _count;
  atomic_t        _mapcount;
  unsigned long     private;
  struct address_space *mapping;
  pgoff_t         index;
  struct list_head    lru;
  void           *virtual;
}

下面来看看这些标志位代表什么?

1.1、标志 flags

flags成员是页面的标志位集合。具体定义在include/linux/page-flags.h文件中。

0 enum pageflags {
  1  PG_locked,      /* 页面已经上锁,不要访问 */
  2  PG_error, /*表示页面发生了I/O错误*/
  3  PG_referenced, /*该标志位用来实现LRU算法中的第二次机会法,详见7.6节*/
  4  PG_uptodate, /*表示页面内容是有效的,当该页面上的读操作完成后,设置该标志位*/
  5  PG_dirty, /*表示页面内容被修改过,为脏页*/
  6  PG_lru, /*表示该页在LRU链表中*/
  7  PG_active, /*表示该页在活跃LRU链表中*/
  8  PG_slab, /*表示该页属于由slab分配器创建的slab*/
  9  PG_owner_priv_1, /* 页面的所有者使用,如果是pagecache页面,文件系统可能使用*/
  10 PG_arch_1, /*与体系结构相关的页面状态位*/
  11 PG_reserved, /*表示该页不可被换出*/
  12 PG_private,/* 表示该页是有效的,当page->private包含有效值时会设置该标志位。如果页面是pagecache,那么包含一些文件系统相关的数据信息*/
  13 PG_private_2, /* 如果是pagecache, 可能包含fs aux data */
  14 PG_writeback,     /* 页面正在回写 */
  15 PG_compound,      /* 一个混合页面*/
  16 PG_swapcache,     /* 这是交换页面 */
  17 PG_mappedtodisk,   /* 在磁盘中分配了blocks */
  18 PG_reclaim,      /* 马上要被回收了 */
  19 PG_swapbacked,     /* 页面支持RAM/swap */
  20 PG_unevictable,    /* 页面是不可收回的*/
  21#ifdef CONFIG_MMU
  22 PG_mlocked,      /* vma处于mlocked状态 */
  23#endif
  24 __NR_PAGEFLAGS,
  25};

这个里面全是标志位,等到用到的时候知道在这里就行。

你是不是以为flags里面只有标志,非也非也。flags另外一个重要作用是可以存放section编号、node编号、zone编号、last_cpuid等。但是关于flags具体到底放的什么?这与内核的配置有关系,

例如 SECTION 编号和 NODE 编号与CONFIG_SPARSEMEM/CONFIG_SPARSEMEM_VMEMMAP配置相关,LAST_CPUPID与CONFIG_NUMA_BALA NCING配置相关。(这里可以看看之前我写的linux内核学习makefile和.config文件)

1.2、 _count和_mapcount 引用计数

_count:表示内核中有多少操作引用这个页面

当引用计数为0说明页面为空闲,那就说明这页面可以被释放了。
内核中常用的加减_count 引用计数的API 为 
get_page()、put_page()、page_cache_get()以及page_cache_release()函数。

_mapcount:表示页面被进程映射的次数,用户页表(pte页表),进程每个是独立的虚拟内存(3G的虚拟空间和独立页表),这就可能存在多个进程都访问一片物理页面。

_mapcount等于−1,表示没有pte映射到页面中。

_mapcount 等于 0,表示只有父进程映射了页面。匿名页面刚分配时,_mapcount引用计数初始化为0。

RMAP反向映射机制就是利用这个特性来实现的。_mapcount引用计数主要用于RMAP反向映射机制中。(通过反向看看这个物理页面还有人用吗?)RMAP就是看这个的值。

对于这两个计数值,很多内核的操作都需要这两个值,比如页面分配机制、反向映射机制、页面回收机制等,因此它是管理物理页面的核心机制。

_count和_mapcount都是atomic_t类型的变量

当需要获得_count和_mapcount的计数值,就采用内核提供的两个宏来统计某个页面的_count和_mapcount的计数。

static inline int page_mapcount(struct page *page)
static inline int page_count(struct page *page)

1.3、mapping字段

用于文件缓存(page cache) :mapping指向和相关联的address_space对象

  • address_space :内存对象(比如索引节点)的页面集合

用于匿名页面(anonymous page):mapping指向anon_vma数据结构。

  • anon_vma数据结构

1.4、lru字段

lru字段主要用在页面回收的LRU链表算法中。

LRU链表算法定义了多个链表,比如活跃链表(Active list)和非活跃链表(Inactive list)等。

在slab机制中,该字段也被用来把一个slab添加到slab满链表、slab空闲链表和slab部分满链表中。

利用这个字段将页面挂接不同链表上?

1.5、virtual字段

这个一看就知道是和虚拟内存有关系,这个是物理页面映射的虚拟内存的地址指针。

当需要动态映射这些高端内存时,字段的值才不位NULL。

当不是高端地址,我们知道物理地址和虚拟地址存在一段线性区,这里这个值就为NULL

因此可以通过这个字段判断这个页面是否是线性映射过来的。

(对于高端任然有丢丢迷惑:1GB内除了768MB的线性区,剩下到1GB的空间叫高端,还是1GB-3GB叫高端,还是两者加起来都是,这里感觉应该是后两者都合适,最后一点更符合。)

2、小结

通过上面的位我们可以得到:

得到页面状态

是否空闲页面

有多少进程在使用

谁在使用页面

页面是否被slab机制使用

这个页面是否是线性映射

我们知道很多页面的属性,但是就页面本身还是没有涉及到。

这是因为内核是给每一个页面分配了一个struct page数据结构,采用mem_map[]数组来存放,其和物理页面是一一对应。因此就不需要再在结构体里用额外的数据描述页面物理地址。(看到这个map就有一对一的感觉了撒)

struct page数据结构的mem_map[]数组定义在 mm/memory.c文件中,

它的初始化在free_area_init_node()->alloc_node_mem_map()函数中。

struct page *mem_map;
EXPORT_SYMBOL(mem_map);

每个物理页面都对应一个struct page数据结构,因此内核社区对于struct page数据结构的大小管控相当严格。

struct page 数据结构大小通常是几十字节,而一个物理页面是 4096字节,假设struct page数据结构占用40字节,那么就相当于要浪费百分之一的内存来存放这些struct page数据结构。

因此,如果在struct page数据结构新增一个变量或者指针,那么系统相当于需要额外千分之一的内存来存放这个新增的指针。假设系统是10GB内存,就要浪费10MB的内存,这种情况挺可怕的。

以上就是物理内存页,下一篇来讲讲物理内存的管理,小少爷辛苦了,休息一下吧。

参考资料:

《奔跑吧 Linux内核》

目录
相关文章
|
1天前
|
存储 缓存 监控
|
3天前
|
内存技术
深入理解操作系统:内存管理与虚拟内存
【4月更文挑战第30天】本文深入探讨了操作系统中的关键组成部分——内存管理,并详细解析了虚拟内存的概念、实现机制及其在现代计算系统中的重要性。我们将从物理内存的分配和回收讲起,逐步引入分页、分段以及虚拟地址空间等概念。文章旨在为读者提供一个清晰的框架,以理解内存管理背后的原理,并通过具体示例加深对虚拟内存技术的理解。
|
3天前
|
存储 Web App开发 运维
|
3天前
|
存储 算法 内存技术
深入理解操作系统内存管理:从虚拟内存到物理内存的映射
【4月更文挑战第30天】 在现代操作系统中,内存管理是一个复杂而关键的功能。它不仅确保了系统资源的有效利用,还为每个运行的程序提供了独立的地址空间,保障了程序之间的隔离性和安全性。本文将探讨操作系统如何通过分页机制和虚拟内存技术实现内存的抽象化,以及这些技术是如何影响应用程序性能的。我们将详细解析虚拟地址到物理地址的转换过程,并讨论操作系统在此过程中扮演的角色。文章的目的是为读者提供一个清晰的框架,以便更好地理解内存管理的工作原理及其对系统稳定性和效率的影响。
|
3天前
|
算法 安全 Linux
深度解析:Linux内核内存管理机制
【4月更文挑战第30天】 在操作系统领域,内存管理是核心功能之一,尤其对于多任务操作系统来说更是如此。本文将深入探讨Linux操作系统的内核内存管理机制,包括物理内存的分配与回收、虚拟内存的映射以及页面替换算法等关键技术。通过对这些技术的详细剖析,我们不仅能够理解操作系统如何高效地利用有限的硬件资源,还能领会到系统设计中的性能与复杂度之间的权衡。
|
5天前
|
监控 Linux
【专栏】如何检查 Linux 内存使用量是否耗尽?这 5 个命令堪称绝了!
【4月更文挑战第28天】在 Linux 中,掌握检查内存使用情况至关重要,因为内存问题可能导致系统性能下降甚至崩溃。本文介绍了 5 个常用的检查内存命令:1) `free` 提供内存和交换区的详细信息;2) `top` 显示进程信息及内存使用;3) `vmstat` 输出系统综合信息,包括内存动态变化;4) `pidstat` 监控特定进程的内存使用;5) `/proc/meminfo` 文件提供系统内存详细数据。了解和使用这些命令能帮助用户及时发现并解决内存相关问题,确保系统稳定运行。
|
7天前
|
Linux
Linux rsyslog占用内存CPU过高解决办法
该文档描述了`rsyslog`占用内存过高的问题及其解决方案。
30 4
|
1月前
|
移动开发 运维 监控
掌握Linux运维利器:查看CPU和内存占用,轻松解决性能问题!
掌握Linux运维利器:查看CPU和内存占用,轻松解决性能问题!
|
1月前
|
监控 Python
【python】实现cpu/内存监控的功能(非常简单)
【python】实现cpu/内存监控的功能(非常简单)
|
1月前
|
Linux
Linux 查看进程PID和线程CPU和内存占用情况
Linux 查看进程PID和线程CPU和内存占用情况
22 0