前言
在C语言操作符详解(上)中,已经详细系统的介绍了各种操作符及其使用场景。接下来,本文将逐步介绍编译器执行这些代码背后所做的事情、操作符优先级、结合性以及求值顺序!
1. 表达式求值
表达式求值的顺序一部分是由操作符的优先级和结合性决定。
同样,有些表达式的操作数在求值的过程中可能需要转换为其他类型。
2 隐式类型转换
C的整型算术运算总是至少以缺省整型类型的精度来进行的。
为了获得这个精度,表达式中的字符和短整型操作数在使用之前被转换成普通整型(int),这种转换称为整型提升。
2.1 整型提升的意义
表达式的整型运算要在CPU的相应运算器件内执行,CPU内整型运算器(ALU)的操作数的字节长度一般就是int的字节长度,同时也是CPU的通用寄存器的长度。
因此,即使两个char类型的相加,在CPU执行时实际上也要先转换为CPU内整型操作数的标准长度。
通用CPU是难以直接实现两个8byte直接相加运算(虽然机器指令中可能有这两种字节相加指令)。所以,表达式中各种长度可能小于int长度的整型值,都必须转换为int和unsigned int,然后才能送入CPU去执行运算。
例子:
char a,b,c ... c=a+b;
上述代码中,c的值如何得到呢?
- b和c的值被提升为普通整型,然后在执行加法运算。
- 加法运算完成之后,结果被截断,然后在存储在c中。
2.2 如何进行整型提升呢?
整型提升是按照变量的数据类型的符号位来提升的。
例子1:
//负数的整型提升 char c1=-1; //变量c1的二进制位(补码)中只有8个比特位 11111111 — (-1的补码) //因为char为有符号位char。所以整型提升的时候,高位补符号位,即为1 //提升之后的结果 11111111111111111111111111111111 //正数的整型提升 char c2=1; //变量c1的二进制位(补码)中只有8个比特位 00000001 — (1的补码) //因为char为有符号位char。所以整型提升的时候,高位补符号位,即为0 //提升之后的结果 00000000000000000000000000000001
例子2:
#include <stdio.h> int main() { char c1 = 5; //00000000000000000000000000000101 //00000101 - c1 (截断) char c2 = 127; //00000000000000000000000001111111 //01111111 - c2 char c3 = c1 + c2; //00000000000000000000000000000101 //00000000000000000000000001111111 //00000000000000000000000010000100 //10000100 - c3 //%d - 10进制的形式打印有符号的整数 //11111111111111111111111110000100 - 补码 //11111111111111111111111110000011 //10000000000000000000000001111100 --> -124 printf("%d\n", c3);//结果为:-124 return 0; }
相关原码、补码和反码知识自行查看:C语言操作符详解(上)
2.3 两个实例说明运算过程中的确发生整型提升!
实例1:
int main() { char a = 0xb6;//10110110 short b = 0xb600; int c = 0xb6000000; if (a == 0xb6)//0xb6为无符号整型 printf("a"); if (b == 0xb600) printf("b"); if (c == 0xb6000000) printf("c"); return 0; }
运行结果:
为什么只打印c,而不是abc同时打印呢?
- 因为实例1中,ab要发生整型提升,但c不需要整型提升。
- a,b整型提升之后,变成了负数,所以表达式a == 0xb6、b == 0xb600的结果为假,但c不发生整型提升,则表达式c == 0xb6000000的接过为真!
实例2:
int main() { char c = 1; printf("%u\n", sizeof(c)); printf("%u\n", sizeof(+c)); printf("%u\n", sizeof(-c)); return 0; }
运行结果:
- 实例2中,c只要参与表达式计算,就会发生整型提升,表达式+c,就会发生提升,所以sizeof(+c)是4byte。
sizeof(-4)同理为4byte。
3. 算术转换
如果某个操作符的各个操作符属于不同的类型,那么除非其中一个操作数转换为另一个操作数的类型,否则操作就无法进行。下面的层次体系称为寻常算术转换。
下面所有类型都>=4byte,且发生向上算术转换!
long double double float unsigned long int long int unsigned int int
- 如果某个操作数的类型在上面这个列表中排名较低,那么首先要转换为另一个操作数的类型后执行计算
警告:
- 但是算术转换要合理,要不然会有一些潜在的问题!!
例子:
float f=3.14 int num=f;//隐式转换,会有精度丢失
4. 操作符属性
复杂表达式的求值有三个影响的因素:
- 操作符的优先级
- 操作符的结合性
- 是否控制求值顺序
两个相邻的操作数先执行那个?取决于它们的优先级。如果两者的优先级相同,取决于它们的结合性。
4.1 操作符优先级
4.2 操作符的结合性
相邻操作符优先级高的先算,低的后算。
但当相邻操作符的优先级相同的情况下,结合性起作用!
- 在上述表格中,在结合性一栏中标有L-R(结合性从左到右)、R-L(结合性从右到左)就是说明该操作符有结合性!
例子:
int main() { //右边都是+,优先级相同,所以考虑结合性。 //+的结合性为L-R(结合性从左到右) //所以2和3先结合相加,得到的值在和5结合相加 int a=2+3+5; return 0; }
4.3 是否控制求值顺序
在观察上面图表中,对于绝大部分操作符是否控制求值顺序,答案是否。只有&&、||、?:、,四个。
- 在上面四个操作符都有一个明显的特定:以&&为例(&&左边如果为假,右边表达式就不执行),其它3个同理,在一定程度上会影响求值顺序!
4.4 是否明确表达式唯一求值顺序?
在我们知道了操作符的优先级、结合性和是否控制求值顺序之后,是不是就可以确定一个表达式具体的位移求值顺序呢?
很遗憾,答案是否定的。
一些有问题的代码:
代码1:
sum=a*b+c*d+e*f;
在代码1计算过程中,由于 * 比+的优先级高,只能保证 * 的计算比+早。但是优先级并不能决定第三个 * 比第一个+早执行!
所以表达式的计算顺序就可能是:
方式1: 方式2: a*b a*b c*d c*d a*b+c*d e*f e*f a*b+c*d a*b+c*d+e*f a*b+c*d+e*f
可能有人会问,上述两种途径最后结果不是都一样吗?
我们将格局放大。如果(a、b、c、d、e、f)每一个变量都想象成一个表达式,且每一个表达式中含有相同的变量,那么两种计算方式将导致结果差异!!
代码2:
c + --c;
- 同上,操作符的优先级只能决定自减–的运算在+的运算前面,但我们并没有办法的知,+操作符的左操作数的获取在右操作数之前还是之后求值。所以结果是不可预测的,有歧义!!
代码3:
int fun() { static int count = 1; return ++count; } int main() { int answer; answer = fun() - fun() * fun(); printf("%d\n", answer); return 0; }
再来看看这个代码有没有实际问题?
有问题!
虽然在大多数的编译器上求得结果都是相同的。
当上述代码answer = fun() - fun() * fun();中,我们只能通过操作符的优先级得知:先算乘法,再算减法。
函数调用先后顺序无法通过操作符的优先级确定
5. 结尾
本篇文章到此就完美结束了。希望能够读者构建起C语言操作符的框架,同时简单理解在运算后面编译器要做的一些事情,能帮读者知道运算结果的过程!
创作不易,如果对你有帮助,记得点赞加关注哦!感谢您的支持!!