x86的cpu处理int类型并不是处理char高效多少

简介:

很多文章上说int类型是最高效的类型,cpu处理这种类型要比其它类型快,比如要比处理char类型快,原因是什么,原因就是他们学过一本国人的教科书,教科书上就这么写的,所以人们就记住了,然而事实为何如此呢?事实上,所谓int比char高效会涉及到很多硬件知识,比如数据总线或者地址总线,比如内存的对齐访问等等。如果一个有心人(比如我)将下面的代码进行了反汇编,那么一步一步的做,最后就会得到一个不一定的答案,或者说是相反的答案,首先看一对C代码,前者是用int类型和0比较,后者是用char和0比较:

int comparetozero_int(int a)

{

if (a == 0)

{

return 0;

}

return 1;

}

char comparetozero_nonint(char c)

{

if ( c == 0 )

{

return 0;

}

return 1;

}

下面用objdump将其反汇编,在windows下用vc调试的话直接进入调试状态然后转到反汇编就可以了,下面看linux下的objdump的结果:

:

push %ebp

mov %esp,%ebp

sub $0x4,%esp

cmpl $0x0,0x8(%ebp)

jne 8048399+0x15>

movl $0x0,0xfffffffc(%ebp)

jmp 80483a0+0x1c>

movl $0x1,0xfffffffc(%ebp)

mov 0xfffffffc(%ebp),%eax

leave

ret

上面的int类型的比较就不多说了,由于是4个字节的,因此很简单,真的很简单,但是comparetozero_nonint呢,看来就不是那么假单了,先看看再说:

:

push %ebp

mov %esp,%ebp

sub $0x8,%esp

mov 0x8(%ebp),%eax

mov %al,0xfffffffc(%ebp)

cmpb $0x0,0xfffffffc(%ebp)

jne 80483c0+0x1b>

movl $0x0,0xfffffff8(%ebp)

jmp 80483c7+0x22>

movl $0x1,0xfffffff8(%ebp)

mov 0xfffffff8(%ebp),%eax

leave

ret

从反汇编中可以看到,并没有像比较int类型时那样在栈中直接比较函数的参数和0,而是先将这个char类型的数据搬运到了局部变量中,然后再比较,可是这是为什么呢?既然有cmpb指令,那么为何不能直接定位到栈中的参数,然后直接比较呢?带着怀疑我写下了下面的汇编函数,这些汇编函数就是直接比较栈中数据的版本:

int comparetozero_nonint(char c)

{

asm volatile("cmpb $0x0,0x8(%%ebp)/n/t"

"jne 1f/n"

"movl $47,%%eax/n"

"jmp 2f/n"

"1:/t"

"movl $32,%%eax/n"

"2:/t"::);

}

经过试验证实这种方式完全可行,那么为何gcc或者vc编译器不将代码直接编译成这样呢?原来这是c语言规范在起着作用,c语言规定了一个类型转换体系,这里就不说了,该体系中有强制转换和自动转换,像char这种类型就是强制转换,就是说两个char参与运算,编译器都要将之转换为int来计算,这主要是在多个处理器中取个交集,就是说该规范照顾了所有的处理器,为何要照顾?很多cpu不能正常处理没有4字节对齐的数据,或者说它们的地址总线的低两位不是总是有效,对于这类处理器,强制转换是为了最少化运行时异常,c语言的规范当然要在标准规范集合中照顾到这种情况,然而这仅仅保证了编译后程序的正确性和稳定性,那么高效性从何而来呢?这就是优化的作用,刚才提到规范是一种共性上的折中,这里的优化当然就是个性的尽情发挥了,比如在x86处理器上没有地址总线的限制,这类处理器上可以说没有什么限制,甚至不要求数据必须对齐,因此在x86机器上编译程序时设置了O1优化,那么代码就会成为下面的样子:

:

push %ebp

mov %esp,%ebp

cmpl $0x0,0x8(%ebp)

setne %al

movzbl %al,%eax

pop %ebp

ret

:

push %ebp

mov %esp,%ebp

cmpb $0x0,0x8(%ebp)

setne %al

movzbl %al,%eax

pop %ebp

ret

由此可见,c语言的规范仅仅是共性的东西,这些规范仅仅是一种设计原则,而不是什么必须的东西,其实本来就没有什么东西是必须的,只有最适合的,而优化后的代码就是最适合的,当然前提是正确性,在x86上,不一定int的效率是最高的,由于x86是cisc的架构,因此可以直接支持很多长度的数据类型的操作,单纯从代码考虑,char不比int差。最后重申一遍,c语言的类型转换仅仅是约定,而优化可以违背这种约定,看看x86机器上的又一个例子,看一个函数:

char abc()

{

char a = 'a',b = 'b';

char c = a+b;

return c;

}

下面两种编译都是正确的:

:

push %ebp

mov %esp,%ebp

sub $0x10,%esp

movb $0x61,0xfffffffd(%ebp)

movb $0x62,0xfffffffe(%ebp)

movzbl 0xfffffffd(%ebp),%edx

movzbl 0xfffffffe(%ebp),%eax

add %edx,%eax

mov %al,0xffffffff(%ebp)

movsbl 0xffffffff(%ebp),%eax

leave

ret

:

push %ebp

mov %esp,%ebp

sub $0x10,%esp

movb $0x61,0xfffffffd(%ebp)

movb $0x62,0xfffffffe(%ebp)

movzbl 0xfffffffd(%ebp),%edx

movzbl 0xfffffffe(%ebp),%eax

lea (%edx,%eax,1),%eax

mov %al,0xffffffff(%ebp)

movsbl 0xffffffff(%ebp),%eax

leave

ret



 本文转自 dog250 51CTO博客,原文链接:http://blog.51cto.com/dog250/1274100

相关文章
|
1月前
|
机器学习/深度学习 人工智能 分布式计算
人工智能平台PAI产品使用合集之int类型是否可以为raw feature
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
2月前
|
存储 关系型数据库 MySQL
MySQL字段的字符类型该如何选择?千万数据下varchar和char性能竟然相差30%🚀
本篇文章来讨论MySQL字段的字符类型选择并深入实践char与varchar类型的区别以及在千万数据下的性能测试
MySQL字段的字符类型该如何选择?千万数据下varchar和char性能竟然相差30%🚀
|
1月前
|
运维 Cloud Native 关系型数据库
云原生数据仓库AnalyticDB产品使用合集之布尔类型和int类型可以自动转换吗
阿里云AnalyticDB提供了全面的数据导入、查询分析、数据管理、运维监控等功能,并通过扩展功能支持与AI平台集成、跨地域复制与联邦查询等高级应用场景,为企业构建实时、高效、可扩展的数据仓库解决方案。以下是对AnalyticDB产品使用合集的概述,包括数据导入、查询分析、数据管理、运维监控、扩展功能等方面。
130 1
|
29天前
详细解读C++char类型函数
详细解读C++char类型函数
17 0
|
2月前
|
存储 C语言
计算 int, float, double 和 char 字节大小
计算 int, float, double 和 char 字节大小。
37 3
|
1月前
|
C++
E0144 “const char *“ 类型的值不能用于初始化 “char *“ 类型的实体
E0144 “const char *“ 类型的值不能用于初始化 “char *“ 类型的实体
|
2月前
channelSftp.put(InputStream src, String dst, int mode);里的mode都是什么类型的
【5月更文挑战第15天】channelSftp.put(InputStream src, String dst, int mode);里的mode都是什么类型的
55 2
|
2月前
|
存储 Web App开发 编译器
C语言程序设计——int,double,char的用法
C语言程序设计——int,double,char的用法
|
2月前
|
关系型数据库 MySQL Java
Java时间转换为MySQL中的INT类型时间戳
Java时间转换为MySQL中的INT类型时间戳
|
2月前
|
C++
【C++】std::string 转换成非const类型 char* 的三种方法记录
【C++】std::string 转换成非const类型 char* 的三种方法记录
37 0