6. 引用
6.1 引用的概念
那C++的引用又是什么东西呢?
引用不是新定义一个变量,而是给已存在变量取了一个别名,编译器不会为引用变量开辟内存空间,一个变量若存在引用,则它和它引用的变量共用同一块内存空间。
比如:武松,别名有武二郎,天伤星,行者等。
那如何定义一个变量的引用呢?
语法:类型& 引用变量名(对象名) = 引用实体;
举个栗子:
int main() { int a = 5; int& b = a; return 0; }
这里b就是a的一个引用。
b就相当于a的一个别名,它们共用同一块内存空间。
a和b的关系就好比武二郎和行者,都是指的武松。
我们可以验证一下:
a和b的地址是一样的。
那我们可不可以给a再取一个别名:
当然可以,就像武松他可以有好几个绰号。
那c是a的一个引用(别名),那我们可不可以给c定义一个引用?
也是可以的。
就相当于我们给同一块空间起了很多个名字。
注意:
引用类型必须和引用实体是同种类型的
整形变量的引用是
int&
字符变量的引用是char&
整形指针变量的引用就是int*&
6.2 引用的特性
- 引用在定义时必须初始化
- 我们定义一个引用,必须对它进行初始化。
- 一个变量可以有多个引用
这个我们在上面就提到了嘛,就好比一个人可以有很多别名。
b、c、d都是a的引用。
- 引用一旦引用一个实体之后,就不能再引用其他实体
什么意思呢?举个栗子:
现在b、c都是a的引用,当然的地址都是一样的:
那我们现在做这样一个事情:
我们新定义一个变量x,把x赋给c(c是a的引用),那现在c会变成x的引用嘛?
不会的,我们上面说了,一个引用在引用一个实体之后,就不能再引用其他实体了,就可以理解为行者已经是武松的绰号了,就不能再成为别人的绰号了。
我们看到b、c地址并没有改变,还是a的引用。
那c = x;
起到的效果是啥呢?
c是a的引用,可以理解为c就是a,那
c = x;
就是把c的值10赋给了a,所以我们现在打印a:
a就是10了。
当然b、c就也是10 了。
6.3 常引用
一起来看:
int a = 1; int& b = a;
定义一个整型变量a,然后给a取了一个别名b,这没问题吧。
然后再看:
const int x = 5; int& y = x;
这样可以吗?
🆗,不行。
为什么呢?
对于引用,还有指针来说,对它们进行赋值和初始化时,权限可以缩小,但不能放大。
什么意思呢?
这里的x是被const修饰的,一个变量被const修饰后就具有了常属性,就不能再被改变了,这也是我们之前C语言的知识了。
但是现在我们想要给它起一个别名(引用)y,而y是没有被const修饰的,也就是说y是可以被改变的,但是它引用的实体却是不可变的。
这是不是相当于给它的权限放大了,所以这样不行。
那我们说指针也具有这样的特性,我们也举个栗子:
const修饰*p1,即p1指向的内容不能被修改,但p2是可以被修改的,所以想把p1赋给p2就是不行的。
这两个就是典型的放大权限的例子
那我们怎么才能够成功赋值呢?
是不是让他们的权限一样大就行了:
这样就可以了
那这种可不可以
可以嘛,权限缩小是可以的。
再来看这个对不对:
int Count() { int n = 0; n++; return n; } int main() { int& ret = Count(); return 0; }
不行,因为这里返回的(ret接收的)是一个临时变量,临时变量具有常属性(不能被修改),所以这里也相当于放大权限了。
至于这里为什么返回的是临时变量,如果大家不明白,先不急,下面使用场景的第二个(做返回值)会对Count函数如何返回进行分析。
那这里也是加一个const就好了:
🆗,我们再来看一个场景:
这个行不行?
首先答案肯定是不行。
拿为什么呢?
大家可能会想,这类型都不一样,肯定不行了。
我刚开始也是这么想的,但是:
欸,为什么啊?
为什么加一个
const
就可以了呢?x就可以成为i的引用(别名)了吗?
那原因在于:
大家要知道,类型转换是会产生临时变量的,不管是强制类型转换,还是隐式类型转换,都是会产生临时变量的。
举个例子:
这里是直接把x转换成浮点型赋给y 了吗?
🆗,不是的,这里会产生一个临时变量,临时变量的值就是x转换成double类型的值,然后把这个临时变量赋值给y。
那我们回过头来看这个程序:
应该是怎么样的:是会产生一个临时变量接收i转换为double类型的值,所以x其实是这个double类型的临时变量的引用,但是报错了,因为临时变量具有常性,所以我们加了一个const之后就好了。
6.4 使用场景
那引用的使用场景有哪些呢?我们一起来看一看:
1. 做参数(传参)
我们先来回忆一个问题:C语言中要想交换两个整型变量,我们是怎么做的?
🆗,我们知道形参是实参的一份临时拷贝,形参的改变不影响实参,所以呢?
我们要传变量的地址过去:
那现在C++引入了引用之后,我们是不是就不用这么麻烦,再传地址过去了啊:
借助引用是不是也能轻松搞定啊:
void Swap(int& px, int& py) { int tmp = px; px = py; py = tmp; } int main() { int num1 = 1; int num2 = 2; Swap(num1, num2); cout << num1 << " " << num2 << endl; return 0; }
我们用两个变量的引用进行交换,是不是就行了啊:
2. 做返回值
那在讲引用做返回值之前,我们首先要做一些铺垫:
我们先来看这样一个程序:
int Count() { int n = 0; n++; return n; } int main() { int ret = Count(); return 0; }
一个很简单的程序,main函数调用Count函数,返回值n赋给了变量ret。
那问大家一个问题:在这个过程中,Count函数返回的n是直接就赋给了ret吗?
🆗,不是的,不能够这样做。
为什么呢?
因为n是不是Count函数中创建的一个局部变量啊,它是存在Count函数的栈帧里的,当函数调用结束,n是不是随着Count函数的栈帧一起被销毁了。当然这里的销毁不是说这块空间不存在了,是归还给操作系统了,但是我们就没有这块空间的使用权了。
所以,函数调用结束我们还能把n这块空间的值赋给ret吗,是不是不行啊。
那这个过程是如何将这个返回值安全的给到ret呢?
那如果大家了解过函数栈帧的创建和销毁就应该知道,这个地方在销毁之前,会产生一个临时变量,来保存要返回的n的值(当要返回的数据比较小的时候,这个临时变量通常是一个寄存器,比较大的时候就不一定是寄存器了)。
然后就算调用结束,n被销毁了,我们也保留了返回值可以赋给main函数的ret。
理解了上一个程序,我们再来看一个:
int Count() { static int n = 0; n++; return n; } int main() { int ret = Count(); return 0; }
与上面的程序相比,唯一的区别就是这次Count函数里的变量n是被static修饰的。
如果大家不太了解或者忘记了static关键字的作用,可以复习一下链接: link
局部变量被static修饰后,将存储在静态区,出作用域后将不会被销毁,而是保留在静态区,生命周期改变(本质上改变了存储类型),这时它的生命周期就是程序的声明周期。
也就是说,这次变量n就不再是保存在函数Count的栈帧里了,而是在静态区,即使函数调用结束栈帧销毁,变量n也依然存在。
哦豁,那这样的话,是不是就可以直接用n去返回了呀。
但实际不是的,编译器在这里是傻瓜式的处理,他不管函数栈帧销毁后n是否存在,所做的处理都是一样的,都是利用一个临时变量去返回。
那既然编译器没有对第二种场景进行优化,那这个权力是不是就给到了我们自己手里啊?
我们能不能想个办法进行一个好的处理呢?
因为既然这个地方函数栈帧销毁后n还在静态区存在,那是不是没必要再去借助寄存器来返回啊?
那我们可以怎么做呢?
🆗,很简单,只需把返回值类型改成n的引用就行了:
那这时返回n的引用,我们说引用和它引用的实体是不是占用同一块空间啊,相当于返回的是n的一个别名,那其实可以认为我们就直接返回n了,就像武二郎和行者都是武松。
那我们再来看一个程序:
int& Add(int a, int b) { int c = a + b; return c; } int main() { int& ret = Add(1, 2); Add(3, 4); cout << "Add(1, 2) is :" << ret << endl; cout << "Add(1, 2) is :" << ret << endl; return 0; }
大家分析一下,思考一下结果是啥?
为什么是这样的结果?
首先不管结果是啥,大家要能够看出来这段代码是有问题的。
什么问题呢?
函数Add中的c是局部变量,是创建在函数栈帧上的,函数调用结束就随着函数栈帧销毁了(这块空间归还给操作系统了),但是,我们最后返回了变量c的引用(别名),而且main函数也用了一个引用来接收,相当于给c的别名(引用)有起了一个别名,即ret也是c的一个引用,那也可以认为ret就是c。
那然后我们去打印ret,就相当于去拿c这块空间的值了,但是这块空间已经归还给操作系统了,已经不属于我们了,此时我们再去访问其实已经是非法的行为了。
但是我们看到也打印出来3 了,这是因为这块空间归还之后,操作系统有可能还没有去清理这块空间,所以我们再去拿还是拿到了原来算出来的3,那如果操作系统进行了一些处理,我们拿到什么可能就不知道了,可能就是随机值了。
就像我们后面又调用了一次,然后打印是7,后面又打印就是一个随机值了。
所以想告诉大家的是:
这里的结果打印出来是几并不重要,可能在不同的编译器上,不同的平台上,就有所差异。
这个结果是未定义的,因为这本身就是一种错误的,非法的行为。
重点是大家要明白这个程序是错误的,这种情况是不能返回引用的。
所以最后总结一下:
如果函数返回时,出了函数作用域,返回对象还在(还没还给系统),则可以使用引用返回(比如:静态的、全局的、malloc的等等),如果已经还给系统了,则必须使用传值返回,若还返回引用,则结果是未定义的。
6.5 传值、传引用效率比较
以值作为参数或者返回值类型,在传参和返回期间,函数不会直接传递实参或者将变量本身直接返回,而是传递实参或者返回变量的一份临时的拷贝,因此用值作为参数或者返回值类型,与传引用相比,效率是比较低的,尤其是当参数或者返回值类型非常大时,效率就更低。
接下来我们就通过两个程序来对比一下:
1. 值和引用的作为参数的性能比较
首先对比一下以值作为函数参数和以引用作为函数参数效率的对比:、
#include <time.h> struct A{ int a[10000]; }; void TestFunc1(A a){} void TestFunc2(A& a){} void TestRefAndValue() { A a; // 以值作为函数参数 size_t begin1 = clock(); for (size_t i = 0; i < 10000; ++i) TestFunc1(a); size_t end1 = clock(); // 以引用作为函数参数 size_t begin2 = clock(); for (size_t i = 0; i < 10000; ++i) TestFunc2(a); size_t end2 = clock(); // 分别计算两个函数运行结束后的时间 cout << "TestFunc1(A)-time:" << end1 - begin1 << endl; cout << "TestFunc2(A&)-time:" << end2 - begin2 << endl; }
程序有些地方大家不懂不用管,我们只是对比一下它们的效率。
2. 值和引用的作为返回值类型的性能比较
#include <time.h> struct A{ int a[10000]; }; A a; // 值返回 A TestFunc1() { return a;} // 引用返回 A& TestFunc2(){ return a;} void TestReturnByRefOrValue() { // 以值作为函数的返回值类型 size_t begin1 = clock(); for (size_t i = 0; i < 100000; ++i) TestFunc1(); size_t end1 = clock(); // 以引用作为函数的返回值类型 size_t begin2 = clock(); for (size_t i = 0; i < 100000; ++i) TestFunc2(); size_t end2 = clock(); // 计算两个函数运算完成之后的时间 cout << "TestFunc1 time:" << end1 - begin1 << endl; cout << "TestFunc2 time:" << end2 - begin2 << endl; }
6.6 引用和指针的区别
下面我们来看一下引用和指针的区别:
首先从语法概念上来说:
引用就是一个别名,没有独立空间,和其引用实体共用同一块空间;
而指针是占用空间的,32位平台上4个字节,64位平台上8个字节,是用来存放地址的。
但是呢?
在实际的底层实现上,引用也是有空间的,因为引用其实就是利用指针来实现的。
看这样一段代码:
int main() { int a = 10; //引用 int& ra = a; ra = 20; //指针 int* pa = &a; *pa = 20; return 0; }
我们通过调试来看一下它们的汇编代码:
可以看到,它们产生的汇编代码都是一样的。
总结一下,指针和引用的区别:
概念上:引用是定义一个变量的别名,指针存储一个变量地址。
引用在定义时必须初始化,指针没有要求(当然最好进行初始化)
引用在初始化时引用一个实体后,就不能再引用其他实体,而指针可以在任何时候指向任何一个同类型实体
没有NULL引用,但有NULL指针
在sizeof中含义不同:引用结果为引用类型的大小,但指针始终是地址空间所占字节个数(32位平台下占4个字节,64位8个字节)
引用自加即引用的实体增加1,指针自加即指针向后偏移一个类型的大小
有多级指针,但是没有多级引用
访问实体方式不同,指针需要显式解引用,引用则是编译器自己处理
引用比指针使用起来相对更安全
7. 内联函数
除了上面的内容,我们C++的祖师爷呢还觉得C语言中的宏也不是很好:
我们在C语言的预处理那一章也有比较详细的学习过宏,也分析了宏的缺点:
当然宏也是有一些优点的:
比如我们定义一个宏函数(当然它不是一个真正的函数),它也可以完成一个函数的功能,但是呢它不用像真正的函数那样建立函数栈帧。
补充:C++中建议用const和枚举enum代替宏定义的常量
从宏的这些优缺点出发,C++又引入了一个新的概念——内联函数。
7.1 概念
那什么是内联函数呢?
以inline修饰的函数叫做内联函数,编译时C++编译器会在调用内联函数的地方展开,没有函数调用建立栈帧的开销,内联函数提升程序运行的效率。
如果是定义一个普通的函数:
我们调试看它的汇编:
大家可能对汇编不太懂,但是看到这个call 函数名(地址)
其实就是去调用这个函数建立栈帧了。
那我们现在把它改成内联函数:
如果在上述函数前增加inline关键字将其改成内联函数,在编译期间编译器会用函数体替换函数的调用。
我们再来看一下反汇编:
怎么没起作用啊。
怎么样让它起作用呢?
🆗,它在release版本下面会起作用,或者在debug版本下需要我们进行一下设置:
然后我们再来看:
这次是不是就没有call Add那个指令了,说明我们的内联函数就起作用了,就没有函数调用建立栈帧的开销了。
7.2 内联函数的特性
inline是一种以空间换时间的做法,如果编译器将函数当成内联函数处理,在编译阶段,会用函数体替换函数调用。
缺陷:可能会使目标文件变大,
优势:少了调用开销,提高程序运行效率。
简单解释一下:
这里说的这个空间换时间,不是说程序运行时占用的空间会变大,而是最终产生的可执行程序可能会变大。
因为C++编译器会在调用内联函数的地方将函数直接展开,这样的话与普通的调用相比,产生的指令就可能变多,所以最终生成的可执行程序可能会变大。
inline对于编译器而言只是一个建议,不同编译器关于inline实现机制可能不同,一般建议:将函数规模较小(即函数不是很长,具体没有准确的说法,取决于编译器内部实现)、不是递归、且频繁调用的函数采用inline修饰,否则编译器会忽略inline特性。
下图为《C++prime》第五版关于inline的建议:
也就是说:
不是所有的内联函数最终都会按照内联函数进行处理的,一般规模较小并且频繁使用的的我们才实现成内联函数,否则即使我们实现成内联函数,编译器也不一定会按照内联函数进行处理。
举个例子:
刚才的Add函数我们用inline修饰后调试发现确实按照内联函数处理了,那如果我们现在在Add函数中再多增加一些语句,有可能就不再按内联函数执行了:
我们再来调试观察一下:
是不是又有call Add了。
内联函数不能声明和定义分离,分离会导致链接错误
因为内联函数编译期间就会在函数调用的地方被展开,不会像普通的函数调用那样call一个地址然后跳转调用,就没有函数地址了(可以认为内联函数不会产生地址进符号表),这样链接的时候就会找不到。
所以内联函数如果有声明的话,把声明定义放一起。
8. auto关键字(C++11)
8.1 类型别名思考
随着不断地学习,往后我们的程序会越来越复杂,程序中用到的类型也可能越来越复杂,经常体现在:
- 类型难于拼写
- 含义不明确导致容易出错
- 比如:
这个std::map::iterator就是一个类型,现在我们还看不懂,还没学到。
这个类型就很长,我们写的时候就很容易可能会写错,怎么简化呢?
大家可能会想到用typedef去取一个别名。
这确实是一个方法。
使用typedef给类型取别名确实可以简化代码,但是typedef也存在一些不好的地方。比如:
typedef char* pstring; int main() { const pstring p1; // 编译成功还是失败? const pstring* p2; // 编译成功还是失败? return 0; }
大家看定义这两个变量有没有什么问题?
🆗,p1这里有错误,为什么呢?
我们自己分析肯定认为p1是这样的?
const char* p1
那这肯定没什么问题嘛,p1是一个字符指针,const 修饰*p1,那就是p1指向的内容不能被改变罢了。
但是,由于这里typedef char* pstring;的缘故,实际上是这样的:
char* const p1;
即const修饰p1,p1不能被修改,而const修饰的变量是必须初始化的,但这里我们没初始化,所以就报错了。
初始化一下就不报错了。
在编程时,常常需要把表达式的值赋值给变量,这就要求在声明变量的时候清楚地知道表达式的类型。
然而有时候要做到这点并非那么容易,因此C++11给auto赋予了新的含义。
在早期C/C++中auto的含义是:使用auto修饰的变量,是具有自动存储器的局部变量,但遗憾的是一直没有人去使用它,大家可以思考下为什么?
8.2 auto简介
C++11中,标准委员会赋予了auto全新的含义即:
auto不再是一个存储类型指示符,而是作为一个新的类型指示符来指示编译器,auto声明的变量在编译阶段编译器会根据初始化表达式来推导auto代表的实际类型。
举一些例子:
定义一个整型变量a,变量b要想接收a,也应该定义成int类型,这没什么问题。
但是,现在我们就可以这样写:
那这时b的类型就不是我们显示指定的,而是根据a自动推导出来的。
当然,其它类型的数据也可以:
我们也可以验证一下b,c,d推断出来的类型对不对:
另外:
使用auto定义变量时必须对其进行初始化
【注意】⚠:
使用auto定义变量时必须对其进行初始化,在编译阶段编译器需要根据初始化表达式来推导auto的实际类型。因此auto并非是一种“类型”的声明,而是一个类型声明时的“占位符”,编译器在编译期会将auto替换为变量实际的类型。
8.3 auto的使用细则
- auto与指针和引用结合起来使用
用auto声明指针类型时,用auto和auto*都可以,但用auto声明引用类型时则必须加&
int main() { int x = 10; auto a = &x; auto* b = &x; auto& c = x; cout << typeid(a).name() << endl; cout << typeid(b).name() << endl; cout << typeid(c).name() << endl; *a = 20; *b = 30; c = 40; return 0; }
2. 在同一行定义多个变量
当在同一行声明多个变量时,这些变量必须是相同的类型,否则编译器将会报错,因为编译器实际只对第一个类型进行推导,然后用推导出来的类型定义其他变量。
int main() { auto a = 1, b = 2; auto c = 3, d = 4.0;// 该行代码会编译失败,因为c和d的初始化表达式类型不同 return 0; }
8.4 auto不能推导的场景
- auto声明的变量不能作为函数的参数
- auto不能作为形参类型,因为编译器无法对其实际类型进行推导。
- auto不能直接用来声明数组
- 为了避免与C++98中的auto发生混淆,C++11只保留了auto作为类型指示符的用法
- auto在实际中最常见的优势用法就是跟以后会讲到的C++11提供的新式for循环,还有lambda表达式等进行配合使用
auto在C++11提供的新式for循环的应用我们下面就会讲到。
9. 基于范围的for循环(C++11)
在我们之前学的C语言以及C++11之前如果要遍历一个数组,我们一般都是这样做的:
int main() { int array[] = { 1, 2, 3, 4, 5 }; for (int* p = array; p < array + sizeof(array) / sizeof(array[0]); ++p) cout << *p << " "; return 0; }
于一个有范围的集合而言,由程序员来说明循环的范围是多余的,有时候还会容易犯错误。
因此C++11中引入了基于范围的for循环。
9.1 范围for的语法
for循环后的括号由冒号“ :”分为两部分:第一部分是范围内用于迭代的变量,第二部分则表示被迭代的范围。
int main() { int array[] = { 1, 2, 3, 4, 5 }; for (auto e : array) cout << e << " "; return 0; }
这样它会自动取数组中的元素赋给e变量,并自动判断结束。
当然这里其实用int就行,但我们刚刚学了auto,用auto的话,如果数组是double或其它类型的元素,我们是不是也可以直接遍历不用改代码啊。
那如果我们现在想改变数组元素的值,可以这样写吗?
int main() { int array[] = { 1, 2, 3, 4, 5 }; for (auto i : array) { i *= 2; cout << i << " "; } for (auto e : array) cout << e << " "; return 0; }
大家看出来了吗?是不是不行啊!
我们上面说了,它是把数组的元素赋值给了前面的遍历i和e,i和e相当于是数组元素的拷贝,所以我们改变i的值,并不会影响数组元素的值。
如果想改变数组元素,我们可以这样做:
int main() { int array[] = { 1, 2, 3, 4, 5 }; for (auto& i : array) { i *= 2; cout << i << " "; } cout << endl; for (auto e : array) cout << e << " "; return 0; }
看出来区别了吗?
i是数组元素的引用(别名),那改变i是不是就相当于改变数组元素了。
注意⚠:
与普通循环类似,可以用continue来结束本次循环,也可以用break来跳出整个循环。
9.2 范围for的使用条件
- for循环迭代的范围必须是确定的
对于数组而言,就是数组中第一个元素和最后一个元素的范围;对于类而言,应该提供begin和end的方法,begin和end就是for循环迭代的范围。
比如这种情况就不能用范围for:
void TestFor(int array[]) { for(auto& e : array) cout<< e <<endl; }
这里我们能看出来是数组传参,数组传参我们指道其实是传的首元素地址,这里虽然用数组接收,但其本质上还是个指针。
🆗,其它还有与范围for相关的知识我们会在后面的学习中讲到,因为有些知识我们现在还没办法很好的理解。
10. 指针空值nullptr(C++11)
在良好的C/C++编程习惯中,声明一个变量时最好给该变量一个合适的初始值,否则可能会出现不可预料的错误,比如未初始化的指针。
如果一个指针没有合法的指向,我们基本都是按照如下方式对其进行初始化:
int* p1 = NULL;
NULL就是空指针嘛,我们学过C语言知道其实NULL就是把0强制类型转换为void*的指针了,实际是一个宏。
那我们来看这样一个代码:
void f(int) { cout << "f(int)" << endl; } void f(int*) { cout << "f(int*)" << endl; } int main() { f(0); f(NULL); return 0; }
这两次函数调用会如何匹配?
欸,NULL不是指针嘛,为什么f(NULL);
调用的也是第一个函数呢?
原因在于NULL在C++ 中的定义发生了一些改变。
NULL实际是一个宏,在传统的C头文件(stddef.h)中,可以看到如下代码:
意思呢就是在C++中NULL其实就是0。
所以要想NULL调用第二个函数:
在C++98中,字面常量0既可以是一个整形数字,也可以是无类型的指针(void*)
常量,但是编译器默认情况下将其看成是一个整形常量,如果要将其按照指针方式来使用,必须对其进行强转。
那由于以上这些原因呢,C++11引入了一个新关键字nullptr来表示空指针:
在使用nullptr表示指针空值时,不需要包含头文件,因为nullptr是C++11作为新关键字引入的。
在C++11中,sizeof(nullptr) 与 sizeof((void*)0)所占的字节数相同。
为了提高代码的健壮性,在后续表示指针空值时建议最好使用nullptr。
🆗,那这篇文章的内容就到这里,欢迎大家指正。下一篇文章开始,我们就进入C++类和对象的学习了!!!