智能指针的讲解

简介: 智能指针的讲解

1.为什么要智能指针

首先我们分析一段代码:

1、如果p1这里new 抛异常会如何?

2、如果p2这里new 抛异常会如何?

3、如果div调用这里又会抛异常会如何?

int div()
{
  int a, b;
  cin >> a >> b;
  if (b == 0)
    throw invalid_argument("除0错误");
  return a / b;
}
void Func()
{
  int* p1 = new int;
  int* p2 = new int;
  cout << div() << endl;
  delete p1;
  delete p2;
}
int main()
{
  try
  {
    Func();
  }
  catch (exception& e)
  {
    cout << e.what() << endl;
  }
  return 0;
}

如果这里的new或者是div函数出现了异常,那么delete语句就没有执行,没有对new起到清理资源,就会发生所谓的内存泄漏,那么这个程序就是有bug的,那么如何解决这个问题呢?

我们先来了解内存泄漏:

2.内存泄漏

2.1 什么是内存泄漏

内存泄漏指因为疏忽或错误造成程序未能释放已经不再使用的内存的情况。内存泄漏并不是指内存在物理上的消失,而是应用程序分配某段内存后,因为设计错误,失去了对该段内存的控制,因而造成了内存的浪费

那么内存泄漏对于程序又会有什么样的危害呢?

如果说这只是一个小小的代码段,它的影响其实不大,但是如果是在像操作系统这样的程序中发生内存泄漏那危害还是蛮大的

长期运行的程序出现内存泄漏,影响很大,如操作系统、后台服务等等,出现内存泄漏会导致响应越来越慢,最终卡死。

例如:

下面代码中的p1和p2申请了动态的空间,但是都没有进行delete释放资源,p3也申请了空间,但是由于func函数出现了异常,delete语句也没有执行,所以资源也没有被释放

void MemoryLeaks()
{
   // 1.内存申请了忘记释放
  int* p1 = (int*)malloc(sizeof(int));
  int* p2 = new int;
  
  // 2.异常安全问题
  int* p3 = new int[10];
  
  Func(); // 这里Func函数抛异常导致 delete[] p3未执行,p3没被释放.
  
  delete[] p3;
}
2.2 内存泄漏分类

C/C++程序中一般我们关心两种方面的内存泄漏:

1 堆内存泄漏(Heap leak)

堆内存指的是程序执行中依据须要分配通过malloc / calloc / realloc / new等从堆中分配的一块内存用完后必须通过调用相应的 free或者delete 删掉。假设程序的设计错误导致这部分内存没有被释放,那么以后这部分空间将无法再被使用,就会产生Heap Leak。

2 系统资源泄漏

指程序使用系统分配的资源,比方套接字、文件描述符、管道等没有使用对应的函数释放掉,导致系统资源的浪费,严重可导致系统效能减少,系统执行不稳定。

2.3 如何避免内存泄漏分类
  1. 工程前期良好的设计规范,养成良好的编码规范,申请的内存空间记着匹配的去释放。ps:这个理想状态。但是如果碰上异常时,就算注意释放了,还是可能会出问题需要下一条智能指针来管理才有保证
  2. 采用RAII思想或者智能指针来管理资源
  3. 有些公司内部规范使用内部实现的私有内存管理库。这套库自带内存泄漏检测的功能选项。
  4. 出问题了使用内存泄漏工具检测。
    总结一下:
    内存泄漏非常常见,解决方案分为两种:
    1、事前预防型。如智能指针等
    2、事后查错型。如泄漏检测工具

3. 智能指针的使用及原理

3.1 RAII

RAII(Resource Acquisition Is Initialization)是一种利用对象生命周期来控制程序资源(如内存、文件句柄、网络连接、互斥量等等)的简单技术。

我们前面提到的智能指针就是RAII的一种产物

它的思想大概就是:

在对象构造时获取资源,接着控制对资源的访问使之在对象的生命周期内始终保持有效,最后在对象析构的时候释放资源。借此,我们实际上把管理一份资源的责任托管给了一个对象

那么这种方法有什么优势呢?

1.不需要显式地释放资源
2.采用这种方式,对象所需的资源在其生命期内始终保持有效

智能指针就是这种思想的体现:

代码中的sp1和sp2都是一个局部对象,它出栈就会自动调用类的析构函数,释放资源,这样我的资源就托管给了类对象,不需要手动地显示释放资源,并且这个资源在此函数生命周期内始终有效

就算是new开空间时出现了异常,他也不会进入构造函数进行初始化,而是结束函数栈帧调用析构函数清理资源

template<class T>
class SmartPtr 
{
public:
    SmartPtr(T* ptr = nullptr)
        : _ptr(ptr)
    {}
    ~SmartPtr()
    {
        if (_ptr)
            delete _ptr;
    }
private:
    T* _ptr;
};
int div()
{
    int a, b;
    cin >> a >> b;
    if (b == 0)
        throw invalid_argument("除0错误");
    return a / b;
}
void Func()
{
    SmartPtr<int> sp1(new int);
    SmartPtr<int> sp2(new int);
    cout << div() << endl;
}
int main()
{
    try {
        Func();
    }
    catch (const exception& e)
    {
        cout << e.what() << endl;
    }
    return 0;
}
3.2 智能指针的原理

其实上面的一段代码还不算是完整的智能指针,因为智能指针的原理决定了它的特殊性质:

1. RAII特性
2. 重载operator*和opertaor->,具有像指针一样的行为。

所以我们还需要重载它的一些指针所需的操作符:

例如-> 和*

template<class T>
class SmartPtr {
public:
    SmartPtr(T* ptr = nullptr)
        : _ptr(ptr)
    {}
    ~SmartPtr()
    {
        if (_ptr)
            delete _ptr;
    }
    T& operator*() { return *_ptr; }
    T* operator->() { return _ptr; }
private:
    T* _ptr;
};
struct Date
{
    int _year=2024;
    int _month=03;
    int _day=13;
};
int main()
{
    SmartPtr<int> sp1(new int);
    *sp1 = 10;
    cout << *sp1 << endl;
    SmartPtr<Date> sparray(new Date);
    // 需要注意的是这里应该是sparray.operator->()->_year = 2018;
    // 本来应该是sparray->->_year这里语法上为了可读性,省略了一个->
    sparray->_year = 2018;
    sparray->_month = 1;
    sparray->_day = 1;
    cout << sparray->_year << sparray->_month << sparray->_day << endl;
}
3.3 std::auto_ptr

C++98版本的库中就提供了auto_ptr的智能指针。

链接: http://www.cplusplus.com/reference/memory/auto_ptr/

但是实际上auto_ptr是有坑的,如果使用者不了解它的特性就会导致野指针的问题

原因就在于它的实现原理,auto_ptr的实现原理:管理权转移的思想

管理权转移是什么意思呢?

就是说当出现两个对象管理同一块资源时,为了防止析构同一块内存两次,我们就将其中一个对象置空,将管理权交给另一个对象

我们也模拟实现了auto_ptr:

namespace jh
{
  template<class T>
  class auto_ptr
  {
  public:
    auto_ptr(T* ptr)
      :_ptr(ptr)
    {}
    auto_ptr(auto_ptr<T>& sp)
      :_ptr(sp._ptr)
    {
      // 管理权转移,将已存在的对象sp置空,管理权交给拷贝对象this
      sp._ptr = nullptr;
    }
    auto_ptr<T>& operator=(auto_ptr<T>& ap)
    {
      //赋值也会涉及管理权转移的问题
      // 检测是否为自己给自己赋值
      if (this != &ap)
      {
        // 释放当前对象中资源
        if (_ptr)
          delete _ptr;
        // 将被赋值对象ap中的管理的资源转移ap中资源到当前对象中
        _ptr = ap._ptr;
        ap._ptr = NULL;
      }
      return *this;
    }
    ~auto_ptr()
    {
      if (_ptr)
      {
        cout << "delete:" << _ptr << endl;
        delete _ptr;
      }
    }
    // 像指针一样使用
    T& operator*()
    {
      return *_ptr;
    }
    T* operator->()
    {
      return _ptr;
    }
  private:
    T* _ptr;
  };
}
int main()
{
  jh::auto_ptr<int> pa1(new int);
  *pa1 = 10;
  cout << *pa1 << endl;
  *pa1 = 20;
  cout << *pa1 << endl;
  jh::auto_ptr<int> pa2(pa1);
  cout << *pa2 << endl;
  //cout << *pa1 << endl;
}

我们将最后一句代码注释掉,程序可以正常运行,并且可以看到不用显示地清理资源,它自动调用了智能指针的析构函数,这个时候管理权转移的缺点还没有展示出来

当我将最后一句执行语句加上后:

可以看到程序崩溃了,因为我解引用了pa1,而pa1因为拷贝构造函数的管理权转移已经被置空了,如果不熟悉的话,代码就很容易出现问题

所以说:auto_ptr是一个失败设计,很多公司明确要求不能使用auto_ptr

3.4 std::unique_ptr

在经历了C++98的失败后,C++11提供了更加靠谱的unique_ptr

http://www.cplusplus.com/reference/memory/unique_ptr/

unique_ptr的实现原理:简单粗暴的防拷贝,下面简化模拟实现了一份UniquePtr来了解它的原理:

可以看到拷贝构造和赋值都用了C++11里面的关键字delete使他禁止生成默认的拷贝构造和赋值

namespace jh
{
  template<class T>
  class unique_ptr
  {
  public:
    unique_ptr(T* ptr)
      :_ptr(ptr)
    {}
    ~unique_ptr()
    {
      if (_ptr)
      {
        cout << "delete:" << _ptr << endl;
        delete _ptr;
      }
    }
    // 像指针一样使用
    T& operator*()
    {
      return *_ptr;
    }
    T* operator->()
    {
      return _ptr;
    }
    unique_ptr(const unique_ptr<T>&sp) = delete;
    unique_ptr<T>& operator=(const unique_ptr<T>&sp) = delete;
  private:
    T* _ptr;
  };
}
int main()
{
  jh::unique_ptr<int> pa1(new int);
  *pa1 = 10;
  jh::unique_ptr<int> pa2(pa1);
}

可以看到我们调用拷贝构造就会报错:

而在C++98中大家的思路虽然也是防止拷贝,但是方式不同:

拷贝构造只声明不定义,但是怕有人在类外定义所以声明为私有

3.4 std::shared_ptr

C++11中开始提供更靠谱的并且支持拷贝的shared_ptr

http://www.cplusplus.com/reference/memory/shared_ptr/

shared_ptr的原理:是通过引用计数的方式来实现多个shared_ptr对象之间共享资源

例如:

老师晚上在下班之前都会通知,让最后走的学生记得把门锁下。

  1. shared_ptr在其内部,给每个资源都维护了着一份计数,用来记录该份资源被几个对象共享
  2. 在对象被销毁时(也就是析构函数调用),就说明自己不使用该资源了,对象的引用计数减一
  3. 如果引用计数是0,就说明自己是最后一个使用该资源的对象,必须释放该资源
  4. 如果不是0,就说明除了自己还有其他对象在使用该份资源,不能释放该资源,否则其他对象就成野指针了

模拟实现如下:

可能有人会问,为什么不直接用int一个count呢,大家想如果都用用int,那么每个对象都会出现一个计数count,如果是多个对象管理一块资源呢?这就会出现问题了

还有人说用静态方案,static int _count,但是静态成员变量是属于这个类的共有的,但是可能会有多个资源,一个资源一个计数,所以静态方案也不适合

namespace jh
{
  template<class T>
  class shared_ptr
  {
  public:
    shared_ptr(T* ptr = nullptr)
      :_ptr(ptr)
      , _pRefCount(new int(1))
      , _pmtx(new mutex)
    {}
    shared_ptr(const shared_ptr<T>& sp)
      :_ptr(sp._ptr)
      , _pRefCount(sp._pRefCount)
      , _pmtx(sp._pmtx)
    {
      AddRef();
    }
    void Release()
    {
      _pmtx->lock();
      bool flag = false;
      if (--(*_pRefCount) == 0 && _ptr)//计数为0进行析构
      {
        cout << "delete:" << _ptr << endl;
        delete _ptr;
        delete _pRefCount;
        flag = true;
      }
      _pmtx->unlock();
      if (flag == true)
      {
        delete _pmtx;
      }
    }
    void AddRef()//计数++
    {
      _pmtx->lock();
      ++(*_pRefCount);
      _pmtx->unlock();
    }
    shared_ptr<T>& operator=(const shared_ptr<T>& sp)
    {
      //if (this != &sp)
      if (_ptr != sp._ptr)//如果管理同一块资源就就不用赋值
      {
        Release();//赋值前判断是否是最后一个对象
        _ptr = sp._ptr;
        _pRefCount = sp._pRefCount;
        _pmtx = sp._pmtx;
        AddRef();
      }
      return *this;
    }
    int use_count()
    {
      return *_pRefCount;
    }
    ~shared_ptr()//析构
    {
      Release();
    }
    // 像指针一样使用
    T& operator*()
    {
      return *_ptr;
    }
    T* operator->()
    {
      return _ptr;
    }
    T* get() const
    {
      return _ptr;
    }
  private:
    T* _ptr;
    int* _pRefCount;//new一个对象的同时,计数++,析构一个对象计数--
    mutex* _pmtx;//由于需要同时访问计数,所以要注意线程安全,上锁
  };

4. 循环引用

循环引用是什么呢?

  1. node1和node2两个智能指针对象指向两个节点,引用计数变成1,我们不需要手动delete。
  2. node1的_next指向node2,node2的_prev指向node1,引用计数变成2。
  3. node1和node2析构,引用计数减到1,但是_next还指向下一个节点。但是_prev还指向上一个节点。
  4. 也就是说_next析构了,node2就释放了。
  5. 也就是说_prev析构了,node1就释放了。
  6. 但是_next属于node的成员,node1释放了,_next才会析构,而node1由_prev管理,_prev属于node2成员,所以这就叫循环引用,谁也不会释放。

例如:

struct ListNode
{
  int _data;
  shared_ptr<ListNode> _prev;
  shared_ptr<ListNode> _next;
  ~ListNode() { cout << "~ListNode()" << endl; }
};
int main()
{
  shared_ptr<ListNode> node1(new ListNode);
  shared_ptr<ListNode> node2(new ListNode);
  cout << node1.use_count() << endl;
  cout << node2.use_count() << endl;
  node1->_next = node2;
  node2->_prev = node1;
  cout << node1.use_count() << endl;
  cout << node2.use_count() << endl;
  return 0;
}

那么该如何解决这个问题呢?

这个时候weak_ptr就出现了!

在引用计数的场景下,把节点中的_prev和_next改成weak_ptr就可以了,原理就是,node1->_next = node2;和node2->_prev = node1;时weak_ptr的_next和_prev不会增加node1和node2的引用计数。

下面给出一个简化版的weak_ptr的模拟实现:

可以看到new新对象的时候没有涉及计数

// 简化版本的weak_ptr实现
 template<class T>
 class weak_ptr
 {
 public:
 weak_ptr()
 :_ptr(nullptr)
 {}
 weak_ptr(const shared_ptr<T>& sp)
 :_ptr(sp.get())
 {}
 weak_ptr<T>& operator=(const shared_ptr<T>& sp)
 {
 _ptr = sp.get();
 return *this;
 }
 T& operator*()
 {
 return *_ptr;
 }
 T* operator->()
 {
 return _ptr;
 }
 private:
 T* _ptr;
 };
}

上面例题的解决方法如下:

这个prev和next就不参与计数了

struct ListNode
{
  int _data;
  weak_ptr<ListNode> _prev;
  weak_ptr<ListNode> _next;
  ~ListNode() { cout << "~ListNode()" << endl; }
};
int main()
{
  shared_ptr<ListNode> node1(new ListNode);
  shared_ptr<ListNode> node2(new ListNode);
  cout << node1.use_count() << endl;
  cout << node2.use_count() << endl;
  node1->_next = node2;
  node2->_prev = node1;
  cout << node1.use_count() << endl;
  cout << node2.use_count() << endl;
  return 0;
}

可以说weak_ptr是专门为循环引用问题而设计的,它有以下特点:

1 不是常规的智能指针,不支持RAII
2 支持指针的功能
3 专门为循环引用设计(指向资源,但是不参与管理,不增加引用计数)

好了,本篇博客的分享到这里就结束了,感谢大家的支持!

相关文章
|
7月前
|
安全 C++
深入理解C++11智能指针
深入理解C++11智能指针
78 1
|
7月前
|
安全 程序员 Linux
【C++】—— c++11之智能指针
【C++】—— c++11之智能指针
|
7月前
|
存储 安全 程序员
C++:智能指针
C++:智能指针
53 5
为什么需要智能指针?
为什么需要智能指针?
45 0
|
7月前
智能指针练习
智能指针练习
|
存储 C++
C++智能指针详解
C++智能指针详解
49 0
|
安全 C++
C++智能指针(下)
C++智能指针(下)