My insight C++——C++中的隐式计数

简介:
<!--[if gte mso 9]> Normal 0 7.8 pt 0 2 false false false MicrosoftInternetExplorer4 <![endif]--><!--[if gte mso 9]> <![endif]-->
C++ 是一种广泛使用的语言,也曾有兴趣略作研究。因为最近一段时间估计不会用它进行开发了,静下心来,谈谈我对它的理解或是发现。
 
(1)  引子
本文谈一谈 C++ 中的隐式计数。隐式计数是一个计数器,因为他的储存空间没有显示的体现在程序代码中,故称之为“隐式”,而“计数”是说该存储空间的功能。这么一说,你首先想到的可能是 C++ 中的 new [] delete [] 操作符,不错,用 new 分配一个数组时,正是使用了“隐式计数”,才使得 delete 该数组指针时,能够获取到数组元素的个数,请看下面的代码,或许你并不陌生:
struct Test
{
Test() { cout << "Test()" << endl; }
~Test() { cout << "~Test()" << endl; }
};
int main()
{
Test *p = new Test[2];
*((int *)p - 1) = 1;
delete[] p;
return 0;
}
看看输出吧,构造函数被调用两次,析构函数被调用一次 ( VC6.0 gcc 中均是如此 ) ,毫无疑问, (int *)p - 1 的位置就是一个计数器,它记录了数组数组元素的个数。
 
(2)  示例 1 —— string 中的隐式计数
我们再来看看下面关于 std::string 的例子:
int main()
{
string s1("Hello");
string s2 = s1;
char *p = const_cast<char *>(s2.c_str());
p[0] = 'M';
cout << s1 << endl;
return 0;
}
上面的程序输出什么?是“ Hello ”吗?答案是不一定 ( 我在 gcc 3.4.6 中是 Mello) 。这实际上取决于 string 类的实现,如果 string 采用了 copy on write 的机制,那么 s1 s2 实际上共享同一段内存,因此上面的代码也修改了 s1 的内容。当然,这都是 const_cast 惹的祸,常规代码对 s1 s2 都是能正常工作的。
上面提到了 copy on write 的共享机制,那么,程序又是如何决定什么时候删除该共享内存呢 ? 答案是引用计数,如果你有兴趣,你可以查看 p 指针的前 4 个字节,发现其值为 1 ,而再添加一个“ string s3 = s1; ”后,其值变为 2 ,毫无疑问,这正是一个引用计数。
 
(3)  示例 2 —— static 中的隐式计数
再看一个关于 static 局部变量的例子。我们知道,如果函数中的 static 变量在定义时赋初值,那么只有在第一次调用该函数时,初始化才被执行,以后的调用都不再执行。那么,编译器又是怎么实现的呢?答案很简单,就是一个标志位,程序初始化时该标志位为 0 ,函数中初始化相关的代码则演变为:检查标志位,如果是 0 ,则对变量进行初始化,然后将标志位置 1 ,否则跳过初始化步骤。这个标志位实际上就是一个隐式的计数器,虽然它只是一个 0-1 计数。
知道了编译器的这个“内幕”,你可以用下面的代码轻易的绕过初始化检查,让函数中的 static 变量在每次被调用时都被初始化 ( 代码有些 BT ,不适者勿看 )
void Test(int initVal)
{
static int i = initVal;
cout << i << endl;
++i;
}
 
int FindAddress()
{
unsigned char *addr = (unsigned char *)&Test;
 
// There is only one instruction in Test: jmp realAddr
if (*addr == 0xe9)
{
addr = addr + *(int *)(addr + 1) + 5;
}
 
// Look forward at most 100 bytes for instruction "and eax 1"
for (int i = 0; i < 64; i++)
{
#ifdef WIN32
if (memcmp(addr + i, "\x83\xe0\x01", 3) == 0)
{
return *(int *)(addr + i - 4);
}
#else
if (addr[i+0] == 0x80 && addr[i+1] == 0x3d && addr[i+6] == 0x00)
{
return *(int *)(addr + i + 2);
}
#endif
}
 
return 0;
}
 
int main()
{
cout << "before modify: " << endl;
 
Test(0);
Test(100);
 
try
{
int flagAddress = FindAddress();
 
if (flagAddress)
{
cout << "After modify: " << endl;
*reinterpret_cast<int *>(flagAddress) = 0;
Test(1000);
}
else
{
cout << "Can not find the flag address" << endl;
}
}
catch (...)
{
cout << "There is some bug in program" << endl;
}
 
return 0;
}
代码的讲解我就不说了,注意的是 FindAddress 函数,其中尝试查找某种特征的指令。
 
(4)  总结
上面举了几个“隐式计数”的例子,它们可能是编译器为了在程序中实现代码面上的功能,而在其中添加的额外数据结构,也可能是库源码中为你所不熟悉的数据结构(如string中的隐式计数)。了解这些深层次的实现,对查排错误或是提高效率都不无裨益。
很少写文章, 写这篇文章的目的,只是希望下次你在用到 C++ 的某个比较“怪异”的特性时,也能有自己的发现, :)。


本文转自Intel_ISN 51CTO博客,原文链接:http://blog.51cto.com/intelisn/130713,如需转载请自行联系原作者
相关文章
|
8月前
|
数据挖掘 C++
C++中的科学计数法
C++中的科学计数法
1410 0
|
8月前
|
C++
比特位计数(C++)
比特位计数(C++)
65 0
|
C++
【C++从0到王者】第十一站:引用计数与写时拷贝
【C++从0到王者】第十一站:引用计数与写时拷贝
56 0
|
机器学习/深度学习 算法 测试技术
C++算法:有向图计数优化版原理及实现
C++算法:有向图计数优化版原理及实现
|
算法 测试技术 C++
C++算法:有向图访问计数的原理及实现
C++算法:有向图访问计数的原理及实现
|
编译器 程序员 C++
C++隐式推导-auto关键词
C++隐式推导-auto关键词
99 0
|
C++ Python
LeetCode每日一题题解:811. 子域名访问计数-题解-python && C++源代码
LeetCode每日一题题解:811. 子域名访问计数-题解-python && C++源代码
|
C++ 编译器
读书笔记 effective c++ Item 41 理解隐式接口和编译期多态
1. 显示接口和运行时多态 面向对象编程的世界围绕着显式接口和运行时多态。举个例子,考虑下面的类(无意义的类), 1 class Widget { 2 public: 3 Widget(); 4 virtual ~Widget(); 5 6 virtual std::...
1126 0
|
2月前
|
存储 编译器 C语言
【c++丨STL】string类的使用
本文介绍了C++中`string`类的基本概念及其主要接口。`string`类在C++标准库中扮演着重要角色,它提供了比C语言中字符串处理函数更丰富、安全和便捷的功能。文章详细讲解了`string`类的构造函数、赋值运算符、容量管理接口、元素访问及遍历方法、字符串修改操作、字符串运算接口、常量成员和非成员函数等内容。通过实例演示了如何使用这些接口进行字符串的创建、修改、查找和比较等操作,帮助读者更好地理解和掌握`string`类的应用。
64 2