【C++要笑着学】虚函数表(VBTL) | 观察虚表指针 | 运行时决议与编译时决议 | 动态绑定与静态绑定 | 静态多态与动态多态 | 单继承与多继承关系的虚表(一)

简介: 虚表是编译器的实现,而非C++的语言标准。上一章我们学习了多态的概念,本章我们深入探讨一下多态的原理。文章开头先说虚表指针,观察编译器的查表行为。首次观察我们先从监视窗口观察美化后的虚表 _vfptr,再透过内存窗口观察真实的 _vfptr。我们还会探讨为什么对象也能切片却不能实现多态的问题。对于虚表到底存在哪?我们会带着大家通过一些打印虚表的方式进行比对!铺垫完虚表的知识后,会讲解运行时决议与编译时决议,穿插动静态的知识点。文章的最后我们会探讨单继承与多继承的虚表,多继承中的虚表神奇的切片指针偏移问题,这块难度较大,后续我们会考虑专门讲解一下,顺带着把钻石虚拟继承给讲了

💭 写在前面


虚表是编译器的实现,而非C++的语言标准。上一章我们学习了多态的概念,本章我们深入探讨一下多态的原理。文章开头先说虚表指针,观察编译器的查表行为。首次观察我们先从监视窗口观察美化后的虚表 _vfptr,再透过内存窗口观察真实的 _vfptr。我们还会探讨为什么对象也能切片却不能实现多态的问题。对于虚表到底存在哪?我们会带着大家通过一些打印虚表的方式进行比对!铺垫完虚表的知识后,会讲解运行时决议与编译时决议,穿插动静态的知识点。文章的最后我们会探讨单继承与多继承的虚表,多继承中的虚表神奇的切片指针偏移问题,这块难度较大,后续我们会考虑专门讲解一下,顺带着把钻石虚拟继承给讲了。


Ⅰ. 虚函数表(VTBL)


0x00 引入:发现虚表的存在

❓ 我们首先来做一道题:sizeof(Base) 是多少(32位下)?

class Base {
public:
  virtual void Func1() {
  cout << "Func1()" << endl;
  }
private:
  int _b = 1;
};
int main(void)
{
    Base b;
    return 0;
}

💡 答案:答案令人诧异,居然是 8。


通过监视窗口我们发现除了 _b 成员外还有了一个 _vfptr 在 b1 对象中:

b90b53af37035e91d72593ad4f2c1190_44cc04d0fb324873b887faab8e2d53ff.png


不监视不知道,一监视吓一跳。这个 _vfptr 是个什么 √8 玩意?


对象中的这个 _vfptr 我们称之为虚表指针(virtual function pointer),我们简称其为 虚表 。


一个含有虚函数的类中都至少有一个像这样的虚函数表指针,虚函数地址都会放到这个表里。


那么虚函数表中放了些什么呢?我们继续往下看。


💬 为了方便演示,我们再多整点函数:

class Base {
public:
  void Func1() {
  cout << "Func1()" << endl;
  }
  virtual void Func2() {
  cout << "Func2()" << endl;
  }
  virtual void Func3() {
  cout << "Func3()" << endl;;
  }
private:
  int _b = 1;
};

63422c45ccd464f5f0eff5513272faa0_9df03b81cf904734b2ff7633456cf682.png

通过监视窗口我们可以看到,虚函数 Func2 和 Func3 都被存进了 _vfptr 中。


虚表虚表,自然是存虚函数的表了,Func1 不是虚函数,自然也就不会存入表中。


0x01 观察虚表指针 _vfptr

❓ 思考:多态是怎么做到指向哪就调用哪的?对于父类的虚表又是什么样的呢?


💬 代码:我们用的是 VS2013 + 64位 环境去观测:


class Base {
public:
  virtual void Func1() {
  cout << "Base::Func1()" << endl;
  }
  virtual void Func2() {
  cout << "Base::Func2()" << endl;
  }
  void Func3() {
  cout << "Base::Func3()" << endl;
  }
private:
  int _b = 1;
};
int main(void)
{
  cout << sizeof(Base) << endl;
  Base b;
  return 0;
}


🔍 监视:我们还是先用监视窗口去做一个简单的观察:

306bcd82b681857ee2283c9f443d876b_19b7642a6759454498ae762b2070f4e2.png

监视窗口是为了方便我们观测优化过的,相当于是一种美化。


注意看,Func3 没有放在 _vfptr 中,又一次证明了这个表里只会存虚函数。


其实虚函数表也没搞什么特殊,也没什么了不起的,虚函数其实是和普通函数一样存在代码段的。


只是普通函数只会进符号表以方便链接,都是 "编译时决议",


而虚函数的地址会被放进虚表,是为了 "运行时决议" 做准备,这个我们后面会细说。


所以这里我们可以这么理解:

735ede6b893c0b74cf4caa529c90fe76_9b288b06e6ac49caa1591a0ea476c8e7.png

📚 虚表的本质:虚表是一个 "存虚函数指针的指针数组" ,一般情况这个数组最后面会放一个空指针。


0x02 虚函数的重写与覆盖

回忆一下,上一章我们介绍重写的时候还说过,"重写" 还可以称为 "覆盖",


这是为什么呢?叫重写似乎更好去理解,覆盖好像很难去理解啊。


💬 代码:现在我们增加一个子类 Derive 去继承 Base:

// 父类 Base
class Base {
public:
  virtual void Func1() {
  cout << "Base::Func1()" << endl;
  }
  virtual void Func2() {
  cout << "Base::Func2()" << endl;
  }
  void Func3() {
  cout << "Base::Func3()" << endl;
  }
private:
  int _b = 1;
};
// 子类 Derive
class Derive : public Base {
public:
  virtual void Func1() {
  cout << "Derive::Func1()" << endl;
  }
private:
  int _d = 2;
};
int main(void)
{
  cout << sizeof(Derive) << endl;
  Derive d;
  return 0;
}

🚩 运行结果:

cd764583e60eab0e1e419889a640e2cc_c0731df4dd324d83a3214067848ba65e.png

(如果没有虚表这里会是8)


🔍 监视:我们再通过监视窗口观察

8b75c8ff3559fb02f8e9dbddea329678_ab71e308a1414be3b66ff94343570e14.png

和父类的相对比,冷静分析后不难发现:

44cd33854167c80a9b3263a02b34a1fb_535147a7579846868967514f000bb234.png


父类 b 对象和子类 d 对象虚表是不一样的,这里看我们发现 Func1 完成了重写,


所以 d 的虚表中存的是重写的 Derive::Func1,所以虚函数的重写也叫做覆盖。


就可以理解为:子类的虚表拷贝了父类的虚表,子类的 Func1 覆盖掉了父类上的 Func1。


(覆盖指的是虚表中虚函数的覆盖)


虚函数重写:语法层的概念,子类对继承父类虚函数实现进行了重写。

虚函数覆盖:原理层的概念,子类的虚表,拷贝父类虚表进行了修改,覆盖重写那个虚函数。

🔺 总结:虚函数的重写与覆盖,重写是语法层的叫法,覆盖是原理层的叫法。


0x03 编译器的查表行为

❓ 思考: 是如何做到指针指向谁就调用谁的虚函数的?好像非常的听♂话:

class Base {
public:
  virtual void Func1() {
  cout << "Base::Func1()" << endl;
  }
  virtual void Func2() {
  cout << "Base::Func2()" << endl;
  }
  void Func3() {
  cout << "Base::Func3()" << endl;
  }
private:
  int _b = 1;
};
class Derive : public Base {
public:
  virtual void Func1() {
  cout << "Derive::Func1()" << endl;
  }
private:
  int _d = 2;
};
int main(void)
{
  Base b;
  Derive d;
  Base* ptr = &b;  
  ptr->Func1();   // 调用的是父类的虚函数
  ptr = &d;
  ptr->Func1();   // 调用的是子类的虚函数
  return 0;
}

🚩 运行结果:

f22a2de0416a1967c988e6ef222a200b_0db7f1679e0b4ce09ae9dfd8a32557cc.png

能不能猜到是跟虚表有关系?它到底要调用哪个函数不是按类型去定的,


如果是按类型去定的那这里调的应该都是父类,结果会都是 Base::Func1() ,所以显然不是。


这里会去 ptr 指针指向的对象里去查表,其实对它自己而言它自己都也不知道调用的是谁,


因为子类切个片,它自己也只能看到父类对象,它根本就没法知道,但是他会查表!


📚 具体行为如下:


编译器会从指向的对象里去找,先在父类对象里找到了 Base::Func1,

Base* ptr = &b; // 指向是b,是父类Base的
  ptr->Func1();   // 调用的是父类的虚函数

然后指向变为 &d,它就从子类对象里找,从而找到了 Derive::Func1。

ptr = &d;       // 指向变成d了,是子类Derive的
ptr->Func1();   // 这时调用的就是子类的虚函数了

所以,多态调用实现是依靠运行时去指向对象的虚表中查,调用函数地址。


0x04 探讨:对象也能切片,为什么不能实现多态?

既然指针和引用可以实现多态,那父类赋值给子类对象也可以切片,


为什么实现不了多态?搞歧视?

Base* ptr = &d;    ✅
Base& ref = d;     ✅ 
Base b = d;    ❓ 为什么不行?都是支持切片的,为什么对象就不行?

从编译器的角度,编译器实现时会判断构不构成多态,不满足规则不构成多态就找到地址,call。


至于为什么实现不了多态,因为实现出来会出现混乱状态。


"即使你是一门语言的设计者,遇到这种问题也很难解决 "


根本原因是:对象切片时,子类对象只会拷贝成员给父类对象,并不会拷贝虚表指针。


因为拷贝了就混乱了,父类对象中到底是父类的虚表指针?还是子类的虚表指针?


那下面的调用是调用父类的虚函数还是子类的虚函数?就不确定了:

ptr = &b;
ptr->func1();    //  ?????????? 父类的func1,还是子类的func1?

对象实现多态又不得不去拷贝虚表,因为它肯定是需要去对象里的虚表里找,


问题是拷贝虚表后就乱了套了。最大问题是 —— 这时候到底调用的是谁的问题。


如果一个父类对象切片拷贝给子类后,切片前指向子类,没切片前指向父类。


"这让人头大"


所以对象不能实现多态,想实现也不行,实现了就乱了套了!


🔺 总结:


一个类对象中的 __vptr 是恒定的,它永远都会指向其所属类的虚表。

而当使用指针或引用时,__vptr 会指向继承类的虚表(从而达成多态的效果)

0x05 透过内存窗口仔细观察 _vfptr

💬 打开监视窗口观察下列代码的虚表:

class Base {
public:
  virtual void Func1() {
  cout << "Base::Func1()" << endl;
  }
  virtual void Func2() {
  cout << "Base::Func2()" << endl;
  }
  void Func3() {
  cout << "Base::Func3()" << endl;
  }
private:
  int _b = 1;
};
class Derive : public Base {
public:
  virtual void Func1() {
  cout << "Derive::Func1()" << endl;
  }
  void Func3() {
  cout << "Derive::Func3()" << endl;
  }
  virtual void Func4() {
  cout << "Derive::Func4()" << endl;
  }
private:
  int _d = 2;
};

从监视窗口观察,有时候会发现,好像有些虚函数再监视窗口显示的虚表里不存在。


这时候千万不能动摇 "只要是虚函数都会存入虚表" 这个事实。


这是监视窗口的锅,我们前面就说了 —— 监视窗口是美化过的!


想要看到真实的样子,我们可以打开内存去查看:

d7671ee18093377f4b335bceeed2228d_8f15dc5c80184fde8954df3b01349102.png

但是这内存看的很让人迷糊,这谁看得懂,知道谁是谁?有什么办法可以把虚表打印出来?


💬 只要取到虚表指针,想打印虚表就很简单了:


虚表是个函数指针数组,该数组里的每个元素存放的是一个函数指针。

typedef void(*V_FUNC)();
/* 打印虚表 */
void Print_VFTable(V_FUNC* arr) {
  printf("vfptr:%p\n", arr);
  for (size_t i = 0; arr[i] != nullptr; i++) {
  printf("[%d]: %p\n", i, arr[i]);
  V_FUNC foo = arr[i];
  foo();
  }
}
int main(void)
{
  Derive d;
  Print_VFTable(
  (V_FUNC*)(*((int*)&d))   // 指针之间是可以互相转换的
  );
    /* 
        语法有规定:完全没有关系的类型强转也不行。
        至少得有一点关系:比如指针和int
        因为指针虽然是地址但是也是表示地址的编号,第几个编号的地址
        指针之间可以随意转换,我想取4个字节,&d 是个 Derive*,
        接引用后就是 Derive,此时强转成 int* 解引用就是取4个字节了。
        由于是 int* 要调用 Print_VFTable 函数传不过去,所以我们最外层又
        强转回 V_FUNC* 了,这是一个函数指针数组的地址指针。
        “内线转外线再转内线”
    */
  return 0;
}

🚩 运行结果:

74859f156a11b9935d826f675b3ef521_fcbd0f8b8e61494889e68e1b7268da3d.png

🔺 结论:VS 监视窗口看到的虚函数表不一定是真实的,可能被处理过。


0x06 虚表的存储位置

虚表,一个类型共用一个类型虚表吗?虚表到底存在哪?

int main(void)
{
  Base b1;
  Base b2;
  Base b3;
  Base b4;
  Print_VFTable((V_FUNC*)(*((int*)&b1)));
  Print_VFTable((V_FUNC*)(*((int*)&b2)));
  Print_VFTable((V_FUNC*)(*((int*)&b3)));
  Print_VFTable((V_FUNC*)(*((int*)&b4)));
  return 0;
}

🚩 运行结果:

53262aacdd90d928f5ad32b2b7728446_e246b49dd25e4033ab8492d37260f6c9.png

🔺 结论:同一个类型它们的虚表内存地址都是一样的,同一类型的对象共用一份虚表。


现在我们知道了同一类型的对象公用一张虚表了,我们再来思考虚表存在哪里的问题。


❓ 思考:虚表到底存在哪里?


虚表放在栈上合理吗?显然不合理,放在栈上虚表跟着这个对象走跟着那个对象走,太不稳定了。


虚表最好能够永久存储,我们希望虚表稳稳地存着。


我们说的对象在构造的时候初始化虚表,实际上不是建立虚表,


按理来说编译的时候就已经把虚表建立好了,会在构造函数的初始化列表阶段把地址存进虚表。

d1e00159f958c711c29e428ae920b4a0_8a734ba72cc7443c8711d7b77f8de260.png

此外,不仅要将虚表放置到永久的区域,不能因为某个对象销毁了这个虚表就没了,


那其他对象住哪?他们可是要共用同一张虚表的!!!所以这个虚表要保证一直都在。


并且还要很容易就能找到,那存在堆上可以吗?


不太行!堆要动态申请,虽然让第一个实例化的对象申请似乎也是可以的,但是堆释放啊!


谁去释放?让最后一个走的对象释放?那不还得加引用计数,所以虚表放堆上也不太可能。


那现在栈也不能存,堆也不能存,就只剩下常量区和数据段了。


静态区和常量区存放好像也很合理,当你实在不确定它到底在哪里的时,


这时候就需要一种 "验证问题的逆向精神",就比如刚才打印虚表指针,正是这种精神。


当然,这很依赖丰富的基础知识,是需要大量练习和实际锻炼的。


💬 比对:


int c = 2;     // 全局变量
int main(void)
{
  Base b1;
  Base b2;
  Base b3;
  Base b4;
  Print_VFTable((V_FUNC*)(*((int*)&b1)));
  Print_VFTable((V_FUNC*)(*((int*)&b2)));
  Print_VFTable((V_FUNC*)(*((int*)&b3)));
  Print_VFTable((V_FUNC*)(*((int*)&b4)));
  int a = 0;
  static int b = 1;   // 静态区
  const char* str = "Hello,World!\n";   // str在栈上,但指向的空间在常量区
  int* p = new int[10];   // p在栈上,但p指向的空间在堆上
  printf("栈: %p\n", &a);
  printf("静态区/数据段: %p\n", &b);
  printf("静态区/数据段: %p\n", &c);
  printf("常量区代码段: %p\n", str);
  printf("代码段: %p\n", str);
  printf("堆: %p\n", p);
  printf("虚表: %p\n", (*((int*)&b4)));
    printf("函数:%p\n", Derive::Func3);
    printf("函数:%p\n", Derive::Func2);
    printf("函数:%p\n", Derive::Func1);
  return 0;
}


🚩 运行结果:

00d30f0f8f27ec74668968e6b5df6ff2_87021655f9b640da9fb452225112b813.png

最合适的地方似乎就是数据段了。


想一想一下虚表是什么,是一个函数指针数组,放到数据段上是再合适不过的了。


🔺 总结:虚表存储在数据段上。

相关文章
|
2月前
|
C++
C++ 根据程序运行的时间和cpu频率来计算在另外的cpu上运行所花的时间
C++ 根据程序运行的时间和cpu频率来计算在另外的cpu上运行所花的时间
37 0
|
3天前
|
编译器 C++
C++入门12——详解多态1
C++入门12——详解多态1
17 2
C++入门12——详解多态1
|
3天前
|
C++
C++入门13——详解多态2
C++入门13——详解多态2
21 1
|
5天前
|
算法 C++
【算法】双指针+二分(C/C++
【算法】双指针+二分(C/C++
|
2月前
|
C语言 C++
vscode——如何在vscode中运行C/C++
vscode——如何在vscode中运行C/C++
42 1
|
2月前
|
存储 编译器 C++
|
3月前
|
存储 安全 C++
浅析C++的指针与引用
虽然指针和引用在C++中都用于间接数据访问,但它们各自拥有独特的特性和应用场景。选择使用指针还是引用,主要取决于程序的具体需求,如是否需要动态内存管理,是否希望变量可以重新指向其他对象等。理解这二者的区别,将有助于开发高效、安全的C++程序。
25 3
|
2月前
|
存储 编译器 C++
C++多态实现的原理:深入探索与实战应用
【8月更文挑战第21天】在C++的浩瀚宇宙中,多态性(Polymorphism)无疑是一颗璀璨的星辰,它赋予了程序高度的灵活性和可扩展性。多态允许我们通过基类指针或引用来调用派生类的成员函数,而具体调用哪个函数则取决于指针或引用所指向的对象的实际类型。本文将深入探讨C++多态实现的原理,并结合工作学习中的实际案例,分享其技术干货。
61 0
|
3月前
|
机器学习/深度学习 算法 C++
C++多态崩溃问题之为什么在计算梯度下降时需要除以批次大小(batch size)
C++多态崩溃问题之为什么在计算梯度下降时需要除以批次大小(batch size)
|
3月前
|
机器学习/深度学习 PyTorch 算法框架/工具
C++多态崩溃问题之在PyTorch中,如何定义一个简单的线性回归模型
C++多态崩溃问题之在PyTorch中,如何定义一个简单的线性回归模型