深入理解c语言_从编译器的角度考虑问题_纪念Dennis Ritchie先生-阿里云开发者社区

开发者社区> 文艺小青年> 正文

深入理解c语言_从编译器的角度考虑问题_纪念Dennis Ritchie先生

简介:
+关注继续查看

开源中国:

 

  Dennis Ritchie教授过世了,他发明了C语言,一个影响深远并彻底改变世界的计算机语言。一门经历40多年的到今天还长盛不训的语言,今天很多语言都受到C的影 响,C++,Java,C#,Perl,PHP,Javascript等等。但是,你对C了解吗?相信你看过本站的《C语言的谜题》还有《谁说C语言很简 单?》。这里,我再写一篇关于深入理解C语言的文章,一方面是缅怀Dennis,另一方面是告诉大家应该如何学好一门语言。。

 

  首先,我们先来看下面这个经典的代码

int main()  
{  
  int a = 42;  
  printf(“%d\n”, a);  
}  

从这段代码里你看到了什么问题?我们都知道,这段程序里少了一个#include <stdio.h> 还少了一个return 0;的返回语句。

  不过,让我们来深入的学习一下,这段代码在C++下无法编译,因为C++需要明确声明函数。这段代码在C的编译器下会编译通过,因为在编译期,编译器会生成一个printf的函数定义,并生成.o文件,链接时,会找到标准的链接库,所以能编译通过。

  但是,你知道这段程序的退出码吗?在ANSI-C下,退出码是一些未定义的垃圾数。但在C89下,退出码是3,因为其取了printf的返回值。为 什么printf函数返回3呢?因为其输出了’4′, ’2′,’\n’ 三个字符。而在C99下,其会返回0,也就是成功地运行了这段程序。你可以使用gcc的 -std=c89或是-std=c99来编译上面的程序看结果。

  另外,我们还要注意main(),在C标准下,如果一个函数不要参数,应该声明成main(void),而main()其实相当于main(…),也就是说其可以有任意多的参数。

我们再来看一段代码:

复制代码
#include <stdio.h> 
void f(void)  
{  
    static int a = 3;  
    static int b;  
    int c;  
    ++a; ++b; ++c;  
    printf("a=%d\n", a);  
    printf("b=%d\n", b);  
    printf("c=%d\n", c);  
}  

int main(void)  
{  
    f();  
    f();  
    f();  
}  
复制代码

 

  这个程序会输出什么?

  我相信你对a的输出相当有把握,就分别是4,5,6,因为那个静态变量。对于c呢,你应该也比较肯定,那是一堆乱数。

但是你可能不知道b的输出会是什么?答案是1,2,3。为什么和c不一样呢?因为,如果要初始化,每次调用函数里,编译器都要初始化函数栈空间,这太费性能了。但是c的编译器会初始化静态变量为0,因为这只是在启动程序时的动作。

  全局变量同样会被初始化。

  说到全局变量,你知道 静态全局变量和一般全局变量的差别吗?是的,对于static 的全局变量,其对链接器不可以见,也就是说,这个变量只能在当前文件中使用。

我们再来看一个例子:

复制代码
#include <stdio.h> 
void foo(void)  
{  
    int a;  
    printf("%d\n", a);  
}  

void bar(void)  
{  
    int a = 42;  
}  
int main(void)  
{  
    bar();  
    foo();  
}  
复制代码

  你知道这段代码会输出什么吗?A) 一个随机值,B) 42。A 和 B都对(在“在函数外存取局部变量的一个比喻”文中的最后给过这个例子),不过,你知道为什么吗?

  如果你使用一般的编译,会输出42,因为我们的编译器优化了函数的调用栈(重用了之前的栈),为的是更快,这没有什么副作用。反正你不初始化,他就是随机值,既然是随机值,什么都无所谓。

  但是,如果你的编译打开了代码优化的开关,-O,这意味着,foo()函数的代码会被优化成main()里的一个inline函数,也就是说没有函数调用,就像宏定义一样。于是你会看到一个随机的垃圾数。

下面,我们再来看一个示例:

复制代码
#include <stdio.h> 

int b(void) { printf(“3”); return 3; }  

int c(void) { printf(“4”); return 4; }  

int main(void)  
{  
    int a = b() + c();  
    printf(“%d\n”, a);  
}  
复制代码

  这段程序会输出什么?,你会说是,3,4,7。但是我想告诉你,这也有可能输出,4,3,7。为什么呢? 这是因为,在C/C++中,表达的评估次序是没有标准定义的。编译器可以正着来,也可以反着来,所以,不同的编译器会有不同的输出。你知道这个特性以后, 你就知道这样的程序是没有可移植性的。

  我们再来看看下面的这堆代码,他们分别输出什么呢?

复制代码
示例一

int a=41; a++; printf("%d\n", a);  

示例二
int a=41; a++ & printf("%d\n", a);
示例三
int a=41; a++ && printf("%d\n", a);
示例四
int a=41; if (a++ < 42) printf("%d\n", a);
示例五
int a=41; aa = a++; printf("%d\n", a);
复制代码

 

只有示例一,示例三,示例四输出42,而示例二和五的行为则是未定义的。关于这种未定义的东西又叫Sequence Points,因为这会让编译器不知道在一个表达式顺列上如何存取变量的值。比如a = a++,a + a++,不过,在C中,这样的情况很少。

下面,再看一段代码:(假设int为4字节,char为1字节)

struct X { int a; char b; int c; };  
printf("%d,", sizeof(struct X));  
struct Y { int a; char b; int c; char d};  
printf("%d\n", sizeof(struct Y));  

 

这个代码会输出什么?

a) 9,10

b)12, 12

c)12, 16

答案是C,我想,你一定知道字节对齐,是向4的倍数对齐。

  但是,你知道为什么要字节对齐吗?还是因为性能。因为这些东西都在内存里,如果不对齐的话,我们的编译器就要向内存一个字节一个字节的取,这样一来,struct X,就需要取9次,太浪费性能了,而如果我一次取4个字节,那么我三次就搞定了。所以,这是为了性能的原因。

  但是,为什么struct Y不向12 对齐,却要向16对齐,因为char d; 被加在了最后,当编译器计算一个结构体的尺寸时,是边计算,边对齐的。也就是说,编译器先看到了int,很好,4字节,然后是 char,一个字节,而后面的int又不能填上还剩的3个字节,不爽,把char b对齐成4,于是计算到d时,就是13 个字节,于是就是16啦。但是如果换一下d和c的声明位置,就是12了。

  另外,再提一下,上述程序的printf中的%d并不好,因为,在64位下,sizeof的size_t是unsigned long,而32位下是 unsigned int,所以,C99引入了一个专门给size_t用的%zu。这点需要注意。在64位平台下,C/C++ 的编译需要注意很多事。你可以参看《64位平台C/C++开发注意事项》。

下面,我们再说说编译器的Warning,请看代码:

复制代码
#include <stdio.h> 
 
int main(void)  
 
{  
 
    int a;  
 
    printf("%d\n", a);  
 
}   
复制代码

 

考虑下面两种编译代码的方式 :

1
2
3
cc -Wall a.c
 
cc -Wall -O a.c

  

前一种是不会编译出a未初化的警告信息的,而只有在-O的情况下,再会有未初始化的警告信息。这点就是为什么我们在makefile里的CFLAGS上总是需要-Wall和 -O。

最后,我们再来看一个指针问题,你看下面的代码:

复制代码
#include <stdio.h> 
int main(void)  
{  
    int a[5];  
    printf("%x\n", a);  
    printf("%x\n", a+1);  
    printf("%x\n", &a);  
    printf("%x\n", &a+1);  
}  
复制代码

 

假如我们的a的地址是:0Xbfe2e100, 而且是32位机,那么这个程序会输出什么?

第一条printf语句应该没有问题,就是 bfe2e100

第二条printf语句你可能会以为是bfe2e101。那就错了,a+1,编译器会编译成 a+ 1*sizeof(int),int在32位下是4字节,所以是加4,也就是bfe2e104

第三条printf语句可能是你最头疼的,我们怎么知道a的地址?我不知道吗?可不就是bfe2e100。那岂不成了a==&a啦?这怎么 可能?自己存自己的?也许很多人会觉得指针和数组是一回事,那么你就错了。如果是 int *a,那么没有问题,a == &a。但是这是数组啊a[],所以&a其实是被编译成了 &a[0]。

第四条printf语句就很自然了,就是bfe2e114。

看过这么多,你可能会觉得C语言设计得真拉淡啊。不过我要告诉下面几点Dennis当初设计C语言的初衷:

1)相信程序员,不阻止程序员做他们想做的事。

2)保持语言的简洁,以及概念上的简单。

3)保证性能,就算牺牲移植性。

今天很多语言进化得很高级了,语法也越来越复杂和强大,但是C语言依然光芒四射,Dennis离世了,但是C语言的这些设计思路将永远不朽。

 本文转自二郎三郎博客园博客,原文链接:http://www.cnblogs.com/haore147/p/3649088.html,如需转载请自行联系原作者

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
阿里云服务器怎么设置密码?怎么停机?怎么重启服务器?
如果在创建实例时没有设置密码,或者密码丢失,您可以在控制台上重新设置实例的登录密码。本文仅描述如何在 ECS 管理控制台上修改实例登录密码。
9789 0
阿里云服务器ECS远程登录用户名密码查询方法
阿里云服务器ECS远程连接登录输入用户名和密码,阿里云没有默认密码,如果购买时没设置需要先重置实例密码,Windows用户名是administrator,Linux账号是root,阿小云来详细说下阿里云服务器远程登录连接用户名和密码查询方法
11464 0
阿里云服务器端口号设置
阿里云服务器初级使用者可能面临的问题之一. 使用tomcat或者其他服务器软件设置端口号后,比如 一些不是默认的, mysql的 3306, mssql的1433,有时候打不开网页, 原因是没有在ecs安全组去设置这个端口号. 解决: 点击ecs下网络和安全下的安全组 在弹出的安全组中,如果没有就新建安全组,然后点击配置规则 最后如上图点击添加...或快速创建.   have fun!  将编程看作是一门艺术,而不单单是个技术。
10870 0
阿里云服务器安全组设置内网互通的方法
虽然0.0.0.0/0使用非常方便,但是发现很多同学使用它来做内网互通,这是有安全风险的,实例有可能会在经典网络被内网IP访问到。下面介绍一下四种安全的内网互联设置方法。 购买前请先:领取阿里云幸运券,有很多优惠,可到下文中领取。
11803 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,阿里云优惠总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系.
13517 0
C语言及程序设计进阶例程-26 回溯溯法问题求解
贺老师教学链接 C语言及程序设计进阶 本课讲解 8皇后问题实现代码 #include &lt;stdio.h&gt; #include &lt;math.h&gt; #include &lt;malloc.h&gt; void nQueens(int *x, int n); /*求解n皇后问题*/ int place(int *x, int k); /*判断是否可以
1004 0
阿里云ECS云服务器初始化设置教程方法
阿里云ECS云服务器初始化是指将云服务器系统恢复到最初状态的过程,阿里云的服务器初始化是通过更换系统盘来实现的,是免费的,阿里云百科网分享服务器初始化教程: 服务器初始化教程方法 本文的服务器初始化是指将ECS云服务器系统恢复到最初状态,服务器中的数据也会被清空,所以初始化之前一定要先备份好。
7176 0
Windows下用C语言连接Mysql注意问题
原文:Windows下用C语言连接Mysql注意问题 环境是:在VS6.0 安装Mysql后,我们需要相应的头文件以及lib文件,所以安装过程必须是完整安装。否则不会生成include文件夹哦~ 具体步骤如下: 1.完全安装mysql,这样才能生成include文件夹。
808 0
C语言及程序设计进阶例程-27 贪心法问题求解
贺老师教学链接 C语言及程序设计进阶 本课讲解 找零钱问题及其求解 #include &lt;stdio.h&gt; int main ( ) { int money[10]={100,50,10,0}; /*最大面额的硬值面值排在最前面,将被优先处理*/ int x; /*找零金额*/ int i=0, n=0, m; scanf
1072 0
3576
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载