C语言嵌入式系统编程修炼之道——性能优化篇

简介:

C语言嵌入式系统编程修炼之道——性能优化篇

作者: 宋宝华  e-mail: [email]21cnbao@21cn.com[/email]

1.使用宏定义

C 语言中,宏是产生内嵌代码的唯一方法。对于嵌入式系统而言,为了能达到性能要求,宏是一种很好的代替函数的方法。
写一个“标准”宏 MIN  ,这个宏输入两个参数并返回较小的一个:
     错误做法:
#define MIN(A,B)    ( A <= B ? A : B )
正确做法:
#define MIN(A,B)  (( A <= (B) ? (A) : (B) )
对于宏,我们需要知道三点:
(1) 宏定义“像”函数;
(2) 宏定义不是函数,因而需要括上所有“参数”;
(3) 宏定义可能产生副作用。
下面的代码:
least = MIN(*p++, b);
将被替换为:
( (*p++) <= (b) ?(*p++):(b) )
发生的事情无法预料。
因而不要给宏定义传入有副作用的“参数”。

2.使用寄存器变量

当对一个变量频繁被读写时,需要反复访问内存,从而花费大量的存取时间。为此, C 语言提供了一种变量,即寄存器变量。这种变量存放在 CPU 的寄存器中,使用时,不需要访问内存,而直接从寄存器中读写,从而提高效率。寄存器变量的说明符是 register 。对于循环次数较多的循环控制变量及循环体内反复使用的变量均可定义为寄存器变量,而循环计数是应用寄存器变量的最好候选者。
(1)                 只有局部自动变量和形参才可以定义为寄存器变量。因为寄存器变量属于动态存储方式,凡需要采用静态存储方式的量都不能定义为寄存器变量,包括:模块间全局变量、模块内全局变量、局部 static 变量;
(2)                register 是一个“建议”型关键字,意指程序建议该变量放在寄存器中,但最终该变量可能因为条件不满足并未成为寄存器变量,而是被放在了存储器中,但编译器中并不报错(在 C++ 语言中有另一个“建议”型关键字: inline )。
下面是一个采用寄存器变量的例子:
/*  1+2+3+….+n 的值  */
WORD Addition(BYTE n)
{
register i,s=0;
for(i=1;i<=n;i++)
{
s=s+i;
}
return s;
}
本程序循环 n 次, i s 都被频繁使用,因此可定义为寄存器变量。

3.内嵌汇编

程序中对时间要求苛刻的部分可以用内嵌汇编来重写,以带来速度上的显著提高。但是,开发和测试汇编代码是一件辛苦的工作,它将花费更长的时间,因而要慎重选择要用汇编的部分。
在程序中,存在一个 80-20 原则,即 20% 的程序消耗了 80% 的运行时间,因而我们要改进效率,最主要是考虑改进那 20% 的代码。
嵌入式 C 程序中主要使用在线汇编,即在 C 程序中直接插入 _asm{  } 内嵌汇编语句:
/*  把两个输入参数的值相加,结果存放到另外一个全局变量中  */
int  result; 
void Add(long  a,  long  *b) 
{ 
    _asm 
   { 
     MOV       AX,  a     
     MOV       BX,  b     
     ADD       AX,  [BX]
     MOV       result, AX
   } 
}   

4.利用硬件特性

首先要明白 CPU 对各种存储器的访问速度,基本上是:
CPU 内部 RAM   >   外部同步 RAM   >  外部异步 RAM   >   FLASH/ROM
对于程序代码,已经被烧录在 FLASH ROM 中,我们可以让 CPU 直接从其中读取代码执行,但通常这不是一个好办法,我们最好在系统启动后将 FLASH ROM 中的目标代码拷贝入 RAM 中后再执行以提高取指令速度;
对于 UART 等设备,其内部有一定容量的接收 BUFFER ,我们应尽量在 BUFFER 被占满后再向 CPU 提出中断。例如计算机终端在向目标机通过 RS-232 传递数据时,不宜设置 UART 只接收到一个 BYTE 就向 CPU 提中断,从而无谓浪费中断处理时间;
如果对某设备能采取 DMA 方式读取,就采用 DMA 读取, DMA 读取方式在读取目标中包含的存储信息较大时效率较高,其数据传输的基本单位是块,而所传输的数据是从设备直接送入内存的(或者相反)。 DMA 方式较之中断驱动方式,减少了 CPU  对外设的干预,进一步提高了 CPU 与外设的并行操作程度。

5.活用位操作

    使用 C 语言的位操作可以减少除法和取模的运算。在计算机程序中数据的位是可以操作的最小数据单位,理论上可以用“位运算”来完成所有的运算和操作,因而,灵活的位操作可以有效地提高程序运行的效率。举例如下:
/*  方法 1 */
int i,j;
i = 879 / 16;
j = 562 % 32;
 
 
/*  方法 2 */
int i,j;
i = 879 >> 4;
j = 562 - (562 >> 5 << 5);
对于以 2 的指数次方为“ * ”、“ / ”或“ % ”因子的数学运算,转化为移位运算“ << >> ”通常可以提高算法效率。因为乘除运算指令周期通常比移位运算大。
C 语言位运算除了可以提高运算效率外,在嵌入式系统的编程中,它的另一个最典型的应用,而且十分广泛地正在被使用着的是位间的与( & )、或( | )、非( ~ )操作,这跟嵌入式系统的编程特点有很大关系。我们通常要对硬件寄存器进行位设置,譬如,我们通过将 AM186ER 80186 处理器的中断屏蔽控制寄存器的第低 6 位设置为 0 (开中断 2 ),最通用的做法是:
#define INT_I2_MASK     0x0040  
wTemp = inword(INT_MASK);
outword(INT_MASK, wTemp &~INT_I2_MASK);
而将该位设置为 1 的做法是:
#define INT_I2_MASK     0x0040  
wTemp = inword(INT_MASK);
outword(INT_MASK, wTemp | INT_I2_MASK);
判断该位是否为 1 的做法是:
#define INT_I2_MASK     0x0040  
wTemp = inword(INT_MASK);
if(wTemp & INT_I2_MASK)
{
       /*  该位为 1 */
}
上述方法在嵌入式系统的编程中是非常常见的,我们需要牢固掌握。

总结

在性能优化方面永远注意 80-20 准备,不要优化程序中开销不大的那 80% ,这是劳而无功的。
宏定义是 C 语言中实现类似函数功能而又不具函数调用和返回开销的较好方法,但宏在本质上不是函数,因而要防止宏展开后出现不可预料的结果,对宏的定义和使用要慎而处之。很遗憾,标准 C 至今没有包括 C++ inline 函数的功能, inline 函数兼具无调用开销和安全的优点。
使用寄存器变量、内嵌汇编和活用位操作也是提高程序效率的有效方法。

除了编程上的技巧外,为提高系统的运行效率,我们通常也需要最大可能地利用各种硬件设备自身的特点来减小其运转开销,例如减小中断次数、利用DMA传输方式等。



 本文转自 21cnbao 51CTO博客,原文链接:http://blog.51cto.com/21cnbao/120785,如需转载请自行联系原作者




相关文章
|
存储 安全 数据管理
C语言之考勤模拟系统平台(千行代码)
C语言之考勤模拟系统平台(千行代码)
252 4
|
程序员 C语言 开发者
pymalloc 和系统的 malloc 有什么区别
pymalloc 和系统的 malloc 有什么区别
|
IDE 编译器 开发工具
【C语言】全面系统讲解 `#pragma` 指令:从基本用法到高级应用
在本文中,我们系统地讲解了常见的 `#pragma` 指令,包括其基本用法、编译器支持情况、示例代码以及与传统方法的对比。`#pragma` 指令是一个强大的工具,可以帮助开发者精细控制编译器的行为,优化代码性能,避免错误,并确保跨平台兼容性。然而,使用这些指令时需要特别注意编译器的支持情况,因为并非所有的 `#pragma` 指令都能在所有编译器中得到支持。
1376 41
【C语言】全面系统讲解 `#pragma` 指令:从基本用法到高级应用
|
存储 编译器 C语言
【C语言】C语言的变量和声明系统性讲解
在C语言中,声明和定义是两个关键概念,分别用于告知编译器变量或函数的存在(声明)和实际创建及分配内存(定义)。声明可以多次出现,而定义只能有一次。声明通常位于头文件中,定义则在源文件中。通过合理组织头文件和源文件,可以提高代码的模块化和可维护性。示例包括全局变量、局部变量、函数、结构体、联合体、数组、字符串、枚举和指针的声明与定义。
518 12
|
11月前
|
监控 关系型数据库 MySQL
【01】客户端服务端C语言-go语言-web端PHP语言整合内容发布-优雅草网络设备监控系统-硬件设备实时监控系统运营版发布-本产品基于企业级开源项目Zabbix深度二开-分步骤实现预计10篇合集-自营版
【01】客户端服务端C语言-go语言-web端PHP语言整合内容发布-优雅草网络设备监控系统-硬件设备实时监控系统运营版发布-本产品基于企业级开源项目Zabbix深度二开-分步骤实现预计10篇合集-自营版
351 0
|
存储 编译器 C语言
【C语言】数据类型全解析:编程效率提升的秘诀
在C语言中,合理选择和使用数据类型是编程的关键。通过深入理解基本数据类型和派生数据类型,掌握类型限定符和扩展技巧,可以编写出高效、稳定、可维护的代码。无论是在普通应用还是嵌入式系统中,数据类型的合理使用都能显著提升程序的性能和可靠性。
586 8
|
C语言 开发者
C语言中的模块化编程思想,介绍了模块化编程的概念、实现方式及其优势,强调了合理划分模块、明确接口、保持独立性和内聚性的实践技巧
本文深入探讨了C语言中的模块化编程思想,介绍了模块化编程的概念、实现方式及其优势,强调了合理划分模块、明确接口、保持独立性和内聚性的实践技巧,并通过案例分析展示了其应用,展望了未来的发展趋势,旨在帮助读者提升程序质量和开发效率。
736 5
|
C语言
C语言编程中,错误处理至关重要,能提升程序的健壮性和可靠性
C语言编程中,错误处理至关重要,能提升程序的健壮性和可靠性。本文探讨了C语言中的错误类型(如语法错误、运行时错误)、基本处理方法(如返回值、全局变量、自定义异常处理)、常见策略(如检查返回值、设置标志位、记录错误信息)及错误处理函数(如perror、strerror)。强调了不忽略错误、保持处理一致性及避免过度处理的重要性,并通过文件操作和网络编程实例展示了错误处理的应用。
423 4
|
存储 算法 C语言
用C语言开发游戏的实践过程,包括选择游戏类型、设计游戏框架、实现图形界面、游戏逻辑、调整游戏难度、添加音效音乐、性能优化、测试调试等内容
本文探讨了用C语言开发游戏的实践过程,包括选择游戏类型、设计游戏框架、实现图形界面、游戏逻辑、调整游戏难度、添加音效音乐、性能优化、测试调试等内容,旨在为开发者提供全面的指导和灵感。
623 2
|
机器学习/深度学习 算法 数据挖掘
C语言在机器学习中的应用及其重要性。C语言以其高效性、灵活性和可移植性,适合开发高性能的机器学习算法,尤其在底层算法实现、嵌入式系统和高性能计算中表现突出
本文探讨了C语言在机器学习中的应用及其重要性。C语言以其高效性、灵活性和可移植性,适合开发高性能的机器学习算法,尤其在底层算法实现、嵌入式系统和高性能计算中表现突出。文章还介绍了C语言在知名机器学习库中的作用,以及与Python等语言结合使用的案例,展望了其未来发展的挑战与机遇。
408 1