很有用的速度优化:让系统启动速度更快

简介: 很有用的速度优化:让系统启动速度更快

嵌入式产品中,系统启动速度是很关键的指标,对系统启动速度的优化,通常我们称之为“快启”。

要对系统启动速度进行优化,首先要知道如何统计系统启动的时间。

下面介绍几种统计内核启动耗时的方法,以及对内核启动速度优化的几个方法。

一、启动耗时统计

printk time

打开kernel配置:

kernel hacking --->
[*] Show timing information on printks

打开后,每个printk的前面都会显示时间戳

主要用来测量内核启动过程各个阶段的耗时

initcall_debug

众所周知,kernel启动时会执行不同等级的initcall,而每个initcall的耗时也是可以统计的。

kernelcmdline中加入参数initcall_debug=1

initcall_debug=1
setargs_nand=setenv bootargs console=${console} earlyprintk=${earlyprintk} root=${nand_root} initcall_debug=${initcall_debug} init=${init}

开启后,就能打印每个initcall函数调用及耗时。

bootgraph

内核自带了一个工具用于统计启动时间:scripts/bootgraph.pl

使用该工具需要打开内核配置CONFIG_PRINTK_TIME=y,并且在cmdline中加上"initcall_debug=1"

系统启动之后,执行命令:

dmesg|perl $(kernel_dir)/script/bootgraph.pl > out.svg

用浏览器查看out.svg文件,可以看到内核启动过程中各个阶段的耗时。

这个工具有点类似于perf的火焰图,可以统计启动各阶段的耗时。

bootchart

除了内核自带的工具,也有开源的工具可用:bootchart

bootchart是一个用于linux启动过程性能分析的开源软件工具,在系统启动过程自动收集CPU占用率、进程等信息,并以图形方式显示分析结果,可用作指导优化系统启动过程。

  • 修改kernel cmdline。将其中的init修改为“init=/sbin/bootchartd”。
  • 收集信息。bootchartd会从/proc/stat/proc/diskstat/proc/[pid]/stat中采集信息,经过处理后保存为bootchart.tgz文件
  • 转换图片。在pc上通过pybootchartgui.py工具将bootchart.tgz转换为bootchart.png,方便分析

最后也会成图片供做分析,例如:

bootchar主要用来测量挂载文件系统到主应用程序启动过程中的耗时

gpio+示波器

可以找一个在系统启动过程中空闲的GPIO,在适当位置设置GPIO电平。

通过示波器抓取波形可以得到各阶段耗时。

通常该方法被用来测量整个启动的耗时,或者各阶段的耗时,该方法也是用的比较多的。

二、内核优化方法

kernel压缩方式

kernel有不同的压缩格式,常见的如gzxzlzma等。

不同的压缩格式,解压速度就不同,通过比较不同压缩方式的启动时间和flash占用情况,选择一种符合实际情况的,以此进行优化。

加载位置

内核镜像可以由kernel自解压,也可以由uboot进行解压。

对于kernel自解压的情况,如果压缩过的kernel与解压后的kernel地址冲突,则会先把自己复制到安全的地方,然后再解压,防止自我覆盖。这就需要耗费复制的时间。

即把加载地址运行地址设置为不同地址,可以减少耗时。

内核裁剪

裁剪内核是必要的,如果内核镜像太大,那么解压内核就需要很长时间,所以内核要尽量裁剪。

裁剪内核,可以减少解压耗时。初始化内容少了,也会减少耗时。

因此裁剪内核时,要考虑将不需要的功能都去掉。

预设置lpj数值

LPJ也就是loops_per_jiffy,每次启动都会计算一次,但如果没有做修改的话,这个值每次启动算出来都是一样的,可以直接提供数值跳过计算。

如下log所示,有skippedlpjtimer计算得来,不需要再校准calibrate了。

[ 0.019918] Calibrating delay loop (skipped), value calculated using timer frequency.. 48.00 BogoMIPS (lpj=240000)

如果没有skipped,则可以在cmdline中添加lpj=xxx进行预设

initcall优化

如前面提到,initcall耗时是可以打印出来的,在cmdline中设置initcall_debug=1,即可打印跟踪所有内核初始化过程中调用的顺序以及耗时。

[ 0.021772] initcall sunxi_pinctrl_init+0x0/0x44 returned 0 after 9765 usecs
[ 0.067694] initcall param_sysfs_init+0x0/0x198 returned 0 after 29296 usecs
[ 0.070240] initcall genhd_device_init+0x0/0x88 returned 0 after 9765 usecs
[ 0.080405] initcall init_scsi+0x0/0x90 returned 0 after 9765 usecs
[ 0.090384] initcall mmc_init+0x0/0x84 returned 0 after 9765 usecs

根据打印信息,可以对耗时较多的initcall进行优化。

内核initcall_module并行

initcall有很多等级,但比较耗时的是module

如果是多核,可以考虑将module_initcall并行执行来节省时间。

目前内核do_initcalls是一个一个按照顺序来执行,可以修改成新建内核线程来执行

减少pty/tty个数

加入initcall打印之后,发现pty/tty init耗时很多,可减少个数来缩短init时间。

initcall pty_init+0x0/0x3c4 returned 0 after 239627 usecs
initcall chr_dev_init+0x0/0xdc returned 0 after 36581 usecs

内核module

只把必须要加进内核的才编译进内核,其他的编译成模块。

例如将必要的clockttypinctrl等编译进内核

三、其他优化

uboot

如果是RISC-V架构,可以考虑去掉uboot

XIP

xipeXecute In Place。即芯片内执行,是指CPU直接从存储器中读取程序代码执行,而不用再读到内存中。

一般我们的程序都是放到flash中,系统启动时,把程序从flash拷贝到ddr中执行,而xip技术则不需要拷贝程序到ddr,所以速度会很快。

这项技术是必须要芯片支持才行,可以看看芯片手册中对SPI的描述是否支持XIP功能。

四、总结

以上对系统启动速度的优化,归根结底是提供一些思路、一些方法。

要优化启动速度,通常来说需要对整个系统的启动有比较深入的了解

优化无止境,需要根据目标来进行优化,综合考虑启动速度和效果。

end

往期推荐

直到我干了底层开发,才知道不写业务代码有多爽

你解决bug的能力,暴露了你的水平

很底层的性能优化:让CPU更快地执行你的代码

机遇:我是如何走向Linux驱动的...

当我用几道题考了一遍做Linux驱动的同事......

相关文章
|
8月前
|
缓存 Linux 数据安全/隐私保护
Linux环境下如何通过手动调用drop_caches命令释放内存
总的来说,记录住“drop_caches” 命令并理解其含义,可以让你在日常使用Linux的过程中更加娴熟和自如。
1411 23
|
Android开发
Android在rootdir根目录创建自定义目录和挂载点的方法
本文介绍了在Android高通平台的根目录下创建自定义目录和挂载点的方法,通过修改Android.mk文件并使用`LOCAL_POST_INSTALL_CMD`变量在编译过程中添加目录,最终在ramdisk.img的系统根路径下成功创建了`/factory/bin`目录。
830 1
|
Ubuntu Android开发
安卓系统调试与优化:(一)bootchart 的配置和使用
本文介绍了如何在安卓系统中配置和使用bootchart工具来分析系统启动时间,包括安装工具、设备端启用bootchart、PC端解析数据及分析结果的详细步骤。
1056 0
安卓系统调试与优化:(一)bootchart 的配置和使用
|
资源调度 算法 Linux
Linux进程/线程的调度机制介绍:详细解析Linux系统中进程/线程的调度优先级规则
Linux进程/线程的调度机制介绍:详细解析Linux系统中进程/线程的调度优先级规则
3817 0
|
运维 前端开发 关系型数据库
高效调试与分析:利用ftrace进行Linux内核追踪(上)
高效调试与分析:利用ftrace进行Linux内核追踪
|
Linux 应用服务中间件 nginx
|
Linux 编译器 C语言
Linux EXPORT_SYMBOL宏详解
Linux EXPORT_SYMBOL宏详解
Linux EXPORT_SYMBOL宏详解
|
Ubuntu Linux Shell
C++ 之 perf+火焰图分析与调试
【11月更文挑战第6天】在遇到一些内存异常的时候,经常这部分的代码是很难去进行分析的,最近了解到Perf这个神器,这里也展开介绍一下如何使用Perf以及如何去画火焰图。
519 5
简单易操作 VsCoe离线安装插件【步骤+图片+插件】
这篇文章介绍了在Visual Studio Code (VSCode) 中进行离线安装插件的详细步骤,包括如何下载插件、以SVN插件为例的离线安装过程、通过命令行安装以及一个更加简单的离线安装方式,还提供了操作界面的截图帮助理解。
简单易操作 VsCoe离线安装插件【步骤+图片+插件】
|
Linux Windows 内存技术
PCIe初始化枚举和资源分配流程分析
本文主要是对PCIe的初始化枚举、资源分配流程进行分析,代码对应的是alikernel-4.19,平台是arm64 ## 1. PCIe architecture ### 1.1 pcie的拓扑结构 在分析PCIe初始化枚举流程之前,先描述下pcie的拓扑结构。 如下图所示: ![11.png](https://ata2-img.oss-cn-zhangjiakou.aliyuncs
9008 1
PCIe初始化枚举和资源分配流程分析