Linux内核源代码分析——第5章 系 统 调 用

简介: 3. sys_reboot29298:内核中其他地方可能都没有sys_reboot的实现方法先进。其原因可以理解为:根据调用的名字我们就可以知道,reboot系统调用可以用来重新启动机器。
3. sys_ reboot
29298: 内核中其他地方可能都没有sys_ reboot的实现方法先进。其原因可以理解为:根据调
用的名字我们就可以知道, reboot系统调用可以用来重新启动机器。根据所提供的参数,它
还能够挂起机器,关闭电源,允许或者禁止使用Ctrl+Alt+Del组合键来重启机器。如果你要
使用这个函数编写代码,需要特别注意它上面的注释标题的警告:首先同步磁盘,否则磁盘
缓冲区中的数据可能会丢失。
由于它可能为系统引发的潜在后果,sys_ reboot需要几个特殊参数,这一点马上就会讨论。
29305:如果调用者不具有CAP_SYS_BOOT(14096行)权能(capability),系统就会返回EP
ERM 错误。权能在第7章中会详细讨论。现在,简单地说就是:权能是检测用户是否具有特定
权限的方法。
29309:在这里,这种偏执的思想充分发挥了作用。syst_ reboot根据从16002到16005行定义
的特殊数字检测参数magic1和magic2。这种思想是:如果sys_ reboot在某种程度上是被偶然
调用的,那么就不太可能再从由magic1和magic2组成的小集合中同时提取值。注意,这并不
意味着这是一个防止粗心的安全措施。
顺便说一下,这些特殊数字并不是随机选取的。第一个参数的关系是十分明显的,它是“感
受死亡(feel dead)”的双关语。后面的三个参数要用十六进制才能了解它们全部的意思:
它们分别是0x28121969,0x5121996,0x16041998。这似乎代表Linus的妻子(或者就是Linu
s自己)和他两个女儿的生日。由此推论,当Linus和他的妻子养育了更多儿女的时候,重启
动需要的特殊参数可能在某种程度上会增加。不过我想在他们用尽32位可能空间之前,他的
妻子就会制止他的行为了。
29315:请求 内核锁,这样能保证这段代码在某一时间只能由一个处理器执行。使用lock_ke
rnel/unlock_kernel“函数对”所保护起来的任何其他代码对其他CPU都同样是不可访问的。
在单处理器的机器中,这只是一个no-op(不处理任何事情);而详细讨论它在多处理器上的
作用则是第10章的内容。
29317:在 LINUX_ REBOOT_CMD_RESTART的情况中,sys_ reboot调用一系列基于 reboot_notifi
er_list的函数来通知它们系统正在重新启动。正常情况下,这些函数都是操作系统关闭时需
要清除的模块的一部分。这个列表函数似乎并不在 内核中的其他地方使用—至少在标准 内核
发行版本中是这样,也许此外的其他模块可能使用这个列表。不管怎样,这个列表的存在可
以方便其他人使用。
LINUX_ REBOOT_CMD_RESTART和其他cmd识别出的值从16023行开始通过#define进行宏定义。这
些值并没有潜在的意义,选用它们的简单原因是它们一般不会发生意外,并且相互之间各不
相同。(有趣的是, LINUX_ REBOOT_CMD _OFF是零,这是在意外情况下最不可能出现的一个值
。但是,由于 LINUX_ REBOOT_CMD_OFF简单地禁止用户使用Ctrl+Alt+Del重新启动机器,它就
是一种“安全”的意外了。)
29321:打印警告信息以后,sys_ reboot调用machine_restart(2185行)重启机器。正如从
2298行中所看到的一样,machine_restart函数从来不会返回。但是不管怎样,对于machine
_restart的调用后面都跟着一个break语句。
这仅仅是经典的良好的编程风格吗?的确如此,但是却又不仅仅如此。文件kernel/sys.c的
代码是属于体系结构无关部分的。但是machine_restart,它显然是体系结构所特有的,属于
代码的体系结构特有的部分(arch/i386/kernel/process.c)。因而对于不同的移植版本也
有所不同。我们并不清楚以后 内核的每个移植版本的实现都不会返回—例如,它可能调度底
层硬件重启但是本身要仍然持续运行几分钟,这就需要首先从函数中返回。或者更为确切的
说法是,由于某些特定的原因,系统可能并不总是能够重启;或许某些软件所控制的硬件根
本就不能重启。在这种平台上,machine_restart就应该可以返回,因此体系结构无关的代码
应该对这种可能性有所准备。
针对这个问题,正式的发行版本中都至少包含一个退出端口,使machine_ restart函数可以
从这个端口返回:m68k端口。不同的基于m68k的机器支持的代码也各不相同,由于本书主要
是针对x86的,我不希望花费过多的时间来解析所有的细节。但是这的确是可能的(在其他情
况下,machine_restart简单进入一个无限循环—既不重新启动机器,也不返回。但是这里我
们担心的是需要返回的情况)。
因此,我们毕竟是需要break的。前面看起来只是简单的习惯甚至是偏执的思想在这里为了内
核的移植性已经变成必须的了。
29324:接下来的两种情况分别允许和禁止臭名昭著的Ctrl+Alt+Del组合键(这三个组合键也
被称为“Vulcan神经收缩(Vulcan nerve pinch)”,“黑客之手(hacker’s claw)”,
“三指之礼(three-fingered salute)”,我最喜欢后面这个)。这些只是简单地设置全局
C_A_D标志(在29160行定义,在29378行检测)。
29332:这种情况和 LINUX_ REBOOT_CMD_RESTART类似,但只是暂停系统而不是将其重新启动。
两者之间的一个区别是它调用machine_halt(2304行)—这是x86上的一条no-op指令,但是
在其他平台上却要完成关闭系统的实际工作—而不是调用machine_restart。并且它会把mac
hine_halt不能暂停的机器转入低功耗模式运行。它使用do_exit(23267行)杀死 内核本身。
29340:到现在为止,这已经是一种比较熟悉的模式了。这里,sys_ reboot关闭机器电源,除
了为可以使用软件自行关闭电源的系统调用machine_power_off(2307行)之外,其他的应该
和暂停机器情况完全相同。
29348: LINUX_ REBOOT_CMD_RESTART2的情况是已建立主题的一个变种。它接收命令,将其作
为ASCII字符串传递,该字符串说明了机器应该如何关闭。字符串不会由sys_ reboot本身来解
释,而是使用machine_restart函数来解释;因而这种模式的意义,如果有的话,就是这些代
码是平台相关的(我使用“如果有”的原因是启动机器—特别是在x86中—一般只有一种方法
,因此其他的信息都可以被machine_restart忽略)。
29365:调用者传递了一个无法识别的命令。sys_ reboot不做任何处理,仅仅返回一个 错误
因此,即使由magic1和magic2传递给sys_ reboot正确的magic数值,它也无须处理任何内容。
29369:一个可识别的命令被传递给sys_ reboot。如果流程执行到这里,它可能就是两个设置
C_A_D的命令之一,因为其他情况通常都是停止或者重新启动机器。在任何情况下,sys_reb
oot都简单把 内核解锁并返回0以表示成功。
4. sys_sysinfo
24142:一个只能返回一个整型值的系统调用。如果需要返回更多的信息,我们只需要使用类
似于在系统调用中传递多于四个参数时所使用的技巧就可以了:我们通过一个指向结构的指
针将结果返回。收集系统资源使用情况的sysinfo系统调用就是这种函数的一个样例。
24144:分配并清空一个struct sysinfo结构(15004行)以暂时存储返回值。sys_sysinfo可
以把结构中的每个域都独立地拷贝出来,但是这样会速度很慢、很不方便,而且必然不容易
阅读。
24148:禁止中断。这在第6章中会有详细的介绍;作为目前来说,我们只要说明这种模式在
使用的过程中能够确保sys_sysinfo正在使用的值不会改变就足够了。
24149:struct sysinfo结构的uptime域用来指明系统已经启动并运行了的秒数。这个值是使
用jiffies(26146行)和HZ来计算的。jiffies计算了系统运行过程中时钟的滴答次数;HZ是
系统相关的一个参数,它十分简单,就是每秒内部时钟滴答的次数。
24151:数组avenrun(27116行)记录了运行队列的平均长度—也就是等待CPU的平均进程数
—在最后的1秒钟、5秒钟和15秒钟。calc_load(27135行)周期性地重复计算它的值。由于
内核中是要严格禁止浮点数运算的,所以只能通过计算变化的次数这一修正值来计算。
24155:同样记录系统中当前运行的进程数。
24158:si_meminfo(07635行)写入这个结构中的内存相关成员,si_swapinfo(38544行)
写入与虚拟内存相关的部分。
24161:现在整个结构都已经全部填充了。sys_sysinfo试图将其拷贝回用户空间,如果失败
就返回EFAULT 错误,如果成功就返回0。
  
 
linux 内核 reboot 2006
 
讲述如何实现 linux 内核reboot

 linux/kernel/sys.c:

asmlinkage long sys_reboot(int magic1, int magic2, unsigned int cmd, void * arg)
这里提供系统调用reboot。可以通过lib引用完成。

case LINUX_REBOOT_CMD_RESTART:
  notifier_call_chain(&reboot_notifier_list, SYS_RESTART, NULL);
  printk(KERN_EMERG "Restarting system.\n");
  machine_restart(NULL);
  break;

linux/arch/arm/kernel/process.c

void machine_restart(char * __unused)
{
 /*
  * Clean and disable cache, and turn off interrupts
  */
 cpu_proc_fin();

 /*
  * Tell the mm system that we are going to reboot -
  * we may need it to insert some 1:1 mappings so that
  * soft boot works.
  */
 setup_mm_for_reboot(reboot_mode);

 /*
  * Now call the architecture specific reboot code.
  */
 arch_reset(reboot_mode);

 /*
  * Whoops - the architecture was unable to reboot.
  * Tell the user!
  */
 mdelay(1000);
 printk("Reboot failed -- System halted\n");
 while (1);
}

linux/include/asm-arm/cpu-multi32.h:

extern const struct processor arm7_processor_functions;
#define cpu_proc_fin()    processor._proc_fin()

linux/arch/arm/mm/proc-arm6,7.S:

/*
 * Purpose : Function pointers used to access above functions - all calls
 *      come through these
 */
  .type arm7_processor_functions, #object
ENTRY(arm7_processor_functions)
  .word cpu_arm7_data_abort
  .word cpu_arm7_check_bugs
  .word cpu_arm7_proc_init
  .word cpu_arm7_proc_fin
  .word cpu_arm7_reset
  .word cpu_arm7_do_idle

  /* cache */
  .word cpu_arm7_cache_clean_invalidate_all
  .word cpu_arm7_cache_clean_invalidate_range
  .word cpu_arm7_flush_ram_page

  /* dcache */
  .word cpu_arm7_dcache_invalidate_range
  .word cpu_arm7_dcache_clean_range
  .word cpu_arm7_dcache_clean_page
  .word cpu_arm7_dcache_clean_entry

  /* icache */
  .word cpu_arm7_icache_invalidate_range
  .word cpu_arm7_icache_invalidate_page

  /* tlb */
  .word cpu_arm7_tlb_invalidate_all
  .word cpu_arm7_tlb_invalidate_range
  .word cpu_arm7_tlb_invalidate_page

  /* pgtable */
  .word cpu_arm7_set_pgd
  .word cpu_arm7_set_pmd
  .word cpu_arm7_set_pte
  .size arm7_processor_functions, . - arm7_processor_functions

linux/include/asm-arm/arch-sa1100/system.h:

static inline void arch_reset(char mode)
{
 if (mode == 's') {
  /* Jump into ROM at address 0 */
  cpu_reset(0);
 } else {
  /* Use on-chip reset capability */
  RSRR = RSRR_SWR;
 }
}

 linux/include/asm-arm/cpu-multi32.h:

#define cpu_reset(addr)    processor.reset(addr)

 linux/arch/arm/mm/proc-arm6,7.S:

ENTRY(cpu_arm7_reset)
  mov r1, #0
  mcr p15, 0, r1, c7, c0, 0  @ flush cache
  mcr p15, 0, r1, c5, c0, 0  @ flush TLB
  mov r1, #0x30
  mcr p15, 0, r1, c1, c0, 0  @ turn off MMU etc
  mov pc, r0

 
 
 
 
目录
相关文章
|
4天前
|
安全 Linux 测试技术
Intel Linux 内核测试套件-LKVS介绍 | 龙蜥大讲堂104期
《Intel Linux内核测试套件-LKVS介绍》(龙蜥大讲堂104期)主要介绍了LKVS的定义、使用方法、测试范围、典型案例及其优势。LKVS是轻量级、低耦合且高代码覆盖率的测试工具,涵盖20多个硬件和内核属性,已开源并集成到多个社区CICD系统中。课程详细讲解了如何使用LKVS进行CPU、电源管理和安全特性(如TDX、CET)的测试,并展示了其在实际应用中的价值。
|
18天前
|
Ubuntu Linux 开发者
Ubuntu20.04搭建嵌入式linux网络加载内核、设备树和根文件系统
使用上述U-Boot命令配置并启动嵌入式设备。如果配置正确,设备将通过TFTP加载内核和设备树,并通过NFS挂载根文件系统。
67 15
|
23天前
|
存储 运维 监控
Linux--深入理与解linux文件系统与日志文件分析
深入理解 Linux 文件系统和日志文件分析,对于系统管理员和运维工程师来说至关重要。文件系统管理涉及到文件的组织、存储和检索,而日志文件则记录了系统和应用的运行状态,是排查故障和维护系统的重要依据。通过掌握文件系统和日志文件的管理和分析技能,可以有效提升系统的稳定性和安全性。
44 7
|
25天前
|
监控 安全 Linux
启用Linux防火墙日志记录和分析功能
为iptables启用日志记录对于监控进出流量至关重要
|
1月前
|
算法 Linux
深入探索Linux内核的内存管理机制
本文旨在为读者提供对Linux操作系统内核中内存管理机制的深入理解。通过探讨Linux内核如何高效地分配、回收和优化内存资源,我们揭示了这一复杂系统背后的原理及其对系统性能的影响。不同于常规的摘要,本文将直接进入主题,不包含背景信息或研究目的等标准部分,而是专注于技术细节和实际操作。
|
1月前
|
存储 缓存 网络协议
Linux操作系统的内核优化与性能调优####
本文深入探讨了Linux操作系统内核的优化策略与性能调优方法,旨在为系统管理员和高级用户提供一套实用的指南。通过分析内核参数调整、文件系统选择、内存管理及网络配置等关键方面,本文揭示了如何有效提升Linux系统的稳定性和运行效率。不同于常规摘要仅概述内容的做法,本摘要直接指出文章的核心价值——提供具体可行的优化措施,助力读者实现系统性能的飞跃。 ####
|
1月前
|
监控 算法 Linux
Linux内核锁机制深度剖析与实践优化####
本文作为一篇技术性文章,深入探讨了Linux操作系统内核中锁机制的工作原理、类型及其在并发控制中的应用,旨在为开发者提供关于如何有效利用这些工具来提升系统性能和稳定性的见解。不同于常规摘要的概述性质,本文将直接通过具体案例分析,展示在不同场景下选择合适的锁策略对于解决竞争条件、死锁问题的重要性,以及如何根据实际需求调整锁的粒度以达到最佳效果,为读者呈现一份实用性强的实践指南。 ####
|
1月前
|
缓存 监控 网络协议
Linux操作系统的内核优化与实践####
本文旨在探讨Linux操作系统内核的优化策略与实际应用案例,深入分析内核参数调优、编译选项配置及实时性能监控的方法。通过具体实例讲解如何根据不同应用场景调整内核设置,以提升系统性能和稳定性,为系统管理员和技术爱好者提供实用的优化指南。 ####
|
1月前
|
负载均衡 算法 Linux
深入探索Linux内核调度机制:公平与效率的平衡####
本文旨在剖析Linux操作系统内核中的进程调度机制,特别是其如何通过CFS(完全公平调度器)算法实现多任务环境下资源分配的公平性与系统响应速度之间的微妙平衡。不同于传统摘要的概览性质,本文摘要将直接聚焦于CFS的核心原理、设计目标及面临的挑战,为读者揭开Linux高效调度的秘密。 ####
44 3
|
1月前
|
消息中间件 安全 Linux
深入探索Linux操作系统的内核机制
本文旨在为读者提供一个关于Linux操作系统内核机制的全面解析。通过探讨Linux内核的设计哲学、核心组件、以及其如何高效地管理硬件资源和系统操作,本文揭示了Linux之所以成为众多开发者和组织首选操作系统的原因。不同于常规摘要,此处我们不涉及具体代码或技术细节,而是从宏观的角度审视Linux内核的架构和功能,为对Linux感兴趣的读者提供一个高层次的理解框架。