lambda表达式
1、引入
在C++98中,如果想要对一个数据集合中的元素进行排序,可以使用std::sort
方法,如果待排序元素为自定义类型,需要用户定义排序时的比较规则:
struct Goods { string _name; // 名字 double _price; // 价格 int _evaluate; // 评价 Goods(const char* str, double price, int evaluate) :_name(str) , _price(price) , _evaluate(evaluate) {} }; struct ComparePriceLess { bool operator()(const Goods& gl, const Goods& gr) { return gl._price < gr._price; } }; struct ComparePriceGreater { bool operator()(const Goods& gl, const Goods& gr) { return gl._price > gr._price; } }; int main() { vector<Goods> v = { { "苹果", 2.1, 5 }, { "香蕉", 3, 4 }, { "橙子", 2.2,3 }, { "菠萝", 1.5, 4 } }; sort(v.begin(), v.end(), ComparePriceLess()); sort(v.begin(), v.end(), ComparePriceGreater()); }
随着C++语法的发展,人们开始觉得上面的写法太复杂了,每次为了实现一个算法,都要重新去写一个类,如果每次比较的逻辑不一样,还要去实现多个类,特别是相同类的命名,这些都给编程者带来了极大的不便。因此,在C++11语法中出现了lambda
表达式。
2、lambda表达式语法
lambda
表达式书写格式:[capture-list] (parameters) mutable -> return-type { statement}
lambda
表达式各部分说明
[capture-list] : 捕捉列表,该列表总是出现在lambda
函数的开始位置,编译器根据[]
来判断接下来的代码是否为lambda
函数,捕捉列表能够捕捉上下文中的变量供lambda
函数使用。- (parameters):参数列表。与普通函数的参数列表一致,如果不需要参数传递,则可以连同()一起省略。
- mutable:默认情况下,
lambda
函数的捕捉列表总是一个const变量,mutable
可以取消其常量性。使用该修饰符时,参数列表不可省略(即使参数为空)。 - ->returntype:返回值类型。用追踪返回类型形式声明函数的返回值类型,没有返回值时此部分可省略。返回值类型明确情况下,也可省略,由编译器对返回类型进行推导。
- {statement}:函数体。在该函数体内,除了可以使用其参数外,还可以使用所有捕获到的变量。
- 注意:
在lambda函数定义中,参数列表和返回值类型都是可选部分,而捕捉列表和函数体可以为空。因此C++11中最简单的lambda
函数为:[]{}; 该lambda
函数不能做任何事情。
所以对于上面的问题我们可以这样写:
int main() { vector<Goods> v = { { "苹果", 2.1, 5 }, { "香蕉", 3, 4 }, { "橙子", 2.2,3 }, { "菠萝", 1.5, 4 } }; sort(v.begin(), v.end(), [](const Goods& g1, const Goods& g2) { return g1._price < g2._price; }); sort(v.begin(), v.end(), [](const Goods& g1, const Goods& g2) { return g1._price > g2._price; }); }
这样写,我们没有必要再为函数或函数对象起名而烦恼,而且也不用当我们看不太懂其中的含义时去跳转到函数定义去看函数是如何实现的,上面我们一眼就能看出比较的方式是什么,也没有必要去写多个仿函数。
通过上述例子可以看出,lambda
表达式实际上可以理解为无名函数,该函数无法直接调用,如果想要直接调用,可借助auto
将其赋值给一个变量。
int main() { int x = 0, y = 1; auto add = [](int x, int y)->int {return x + y; }; cout << add(x, y) << endl; return 0; }
3、 捕获列表说明
捕捉列表描述了上下文中那些数据可以被lambda
使用,以及使用的方式传值还是传引用。
- [var]:表示值传递方式捕捉变量var
- [=]:表示值传递方式捕获所有父作用域中的变量(包括this)
- [&var]:表示引用传递捕捉变量var
- [&]:表示引用传递捕捉所有父作用域中的变量(包括this)
- [this]:表示值传递方式捕捉当前的this指针
注意:
- 语法上捕捉列表可由多个捕捉项组成,并以逗号分割。
比如:[=, &a, &b]:以引用传递的方式捕捉变量a和b,值传递方式捕捉其他所有变量,[&,a, this]:值传递方式捕捉变量a和this,引用方式捕捉其他变量 - 捕捉列表不允许变量重复传递,否则就会导致编译错误。
比如:[=, a]:=已经以值传递方式捕捉了所有变量,捕捉a重复 - lambda函数能捕捉最外域(非全局域)的所有变量。
- lambda函数捕捉列表不能捕捉全局变量和静态变量。
- lambda表达式之间不能相互赋值,即使看起来类型相同。
// 函数指针 void (*PF)(); int main() { auto f1 = [] {cout << "hello world" << endl; }; auto f2 = [] {cout << "hello world" << endl; }; // 此处先不解释原因,等lambda表达式底层实现原理看完后就知道了 //f1 = f2; // 编译失败--->提示找不到operator=() // 允许使用一个lambda表达式拷贝构造一个新的副本 auto f3(f2); f3(); // 可以将lambda表达式赋值给相同类型的函数指针 PF = f2; PF(); return 0; }
捕捉列表的使用
int main() { // 最简单的lambda表达式, 该lambda表达式没有任何意义 [] {}; // 省略参数列表和返回值类型,返回值类型由编译器推导为int int a = 3, b = 4; [=] {return a + 3; }; // 省略了返回值类型,无返回值类型 auto fun1 = [&](int c) {b = a + c; }; fun1(10); cout << a << " " << b << endl; // 各部分都很完善的lambda函数 auto fun2 = [=, &b](int c)->int {return b += a + c; }; cout << fun2(10) << endl; // 复制捕捉x int x = 10; auto add_x = [x](int a) mutable { x *= 2; return a + x; }; cout << add_x(10) << endl; return 0; }
4、 lambda表达式的原理
class Rate { public: Rate(double rate) : _rate(rate) {} // 计算利息 double operator()(double money, int year) { return money * _rate * year; } private: double _rate; }; int main() { double rate = 0.49; // 函数对象 Rate r1(rate); r1(10000, 2); // lambda表达式 auto r2 = [=](double monty, int year)->double {return monty * rate * year;}; r2(10000, 2); return 0; }
从使用方式上来看,函数对象与lambda表达式完全一样:
- 函数对象将rate作为其成员变量,在定义对象时给出初始值即可。
- lambda表达式通过捕获列表可以直接将该变量捕获。
其实底层中,lambda
对象就是一个函数对象,只不过lambda的函数在底层都是一个叫 lambda_uuid 的类。
uuid是用唯一识别码,它根据某种算法能在一个系统内生成不同的字符串,保证字符串不重复,于是我们的lambda_uuid的类就不会同名,我们也不用担心命名问题。
将上述代码转换为汇编代码:
所以实际在底层编译器对于lambda表达式的处理方式,完全就是按照函数对象的方式处理的,即:如果定义了一个lambda表达式,编译器会自动生成一个类,在该类中重载了operator()。
5、 lambda对象的大小
所以上述的lambda表达式的大小是多少呢?
答案是:和捕捉列表中的对象的实际使用情况有关,因为lambda表达式在底层是被编译器看成仿函数的,所以捕捉列表中的对象那个实际被使用了,在仿函数内部就创建了那个对象同类型的类内成员。
// 仿函数 class Rate { public: Rate(double rate) : _rate(rate) {} // 计算利息 double operator()(double money, int year) { return money * _rate * year; } private: double _rate; }; int main() { // 多增加的变量,让捕捉列表有更多的变量可以捕捉 int tmp = 10; // 利率 double rate = 0.49; // 函数对象 Rate r1(rate); r1(10000, 2); // lambda表达式捕捉全部变量: tmp, rate(真实被使用的), r1 auto r2 = [=](double monty, int year)->double {return monty * rate * year;}; r2(10000, 2); // lambda表达式不捕捉 auto r3 = [](double monty, int year)->double {return monty * year;}; // 分别求大小 cout << sizeof(r1) << endl; cout << sizeof(r2) << endl; cout << sizeof(r3) << endl; return 0; }
- r1函数对象是8,因为内部有一个
double
类型的变量。 - r2函数对象是8,因为内部有一个
double
类型的变量,多余的其它变量没有使用,所以在底层看r2的结构与r1相同,只是类名不同罢了。 - r3函数对象是1,其没有捕捉对象,所以其内部没有成员变量,只有
operator()
运算符重载,而在C++中空类对象的大小为1,所以r1的大小为1。