安全编程-c++野指针和内存泄漏

简介: 摘要:   尽管C++ 野指针和内存泄漏一直被诟病,但是在实时性很强的应用场合,c++ 仍然是不二之选。游戏服务器开发仍然使用c++ 作为主语言,但是大多结合动态脚本技术,一方面规避了野指针和内存泄露,一方面获得了开发效率和扩展性的红利。

摘要:

  尽管C++ 野指针和内存泄漏一直被诟病,但是在实时性很强的应用场合,c++ 仍然是不二之选。游戏服务器开发仍然使用c++ 作为主语言,但是大多结合动态脚本技术,一方面规避了野指针和内存泄露,一方面获得了开发效率和扩展性的红利。但脚本技术不是本文的讨论重点,事实上关于c++ 与 lua的技术文章我也一直在整理中,将会另文别述。今天主要说说在使用c++过程中,如何避免和解决野指针和内存泄漏问题。

野指针:

  野指针的出现会导致程序崩溃,这是每个人都不愿意看到的。Linux会生成coredump文件,可用gdb分析。Win下可以注册unexception获取调用堆栈,将错误信息写到文件中。先分析一下通常出现野指针的场景:

class monster_t
{
protected:
    player_t* m_attack;

public:
    void handle_ai()
    {
        if (m_attack)
        {
            int x = m_attack->get_x();
        }
    }
}

 

  问题就在于,m_attack有值,但是对应的对象已经被销毁了。这是大部分野指针出现原因。分析类之间关系可知,monster_t 和 player_t是0-1的关系,monster_t引用player_t,但是player_t甚至都不知道有一个(或N个)monster 引用了自己。所以当player被销毁时,很难做到把所有引用该player_t的地方全部重置。这种问题其实比较常见,比如player中引用connection,而connection又是被网络层管理生命周期的,也同样容易产生野指针情况。常见的解决方式是:

 

class monster_t
{
protected:
    long m_attack_id;

public:
    void handle_ai()
    {
        player_t* attack = obj_mgr.get(m_attack_id);
        if (attack)
        {
            int x = attack->get_x();
        }
    }
}

 

另外一种与之相似的方式:

class monster_t
{
protected:
    player_t* m_attack;

public:
    void handle_ai()
    {
        if (obj_mgr.is_exist(m_attack))
        {
            int x = m_attack->get_x();
        }
        else
        {
            m_attack = NULL;
        }
    }
}

 

  梳理野指针的产生原因后,我们其实需要的是这样的指针:

  一种指针,引用了另一个对象的地址(不然就不是指针了),当目标对象销毁时,该指针自然指向null,而不需要目标对象主动通知重置。

幸运的是,这种指针已经有了,就是weak_ptr; 在boost库中,sharedptr,scopedptr,weakptr统称为smartptr。可以尽量使用智能指针,避免野指针。本人建议尽量使用shared_ptr结合weak_ptr使用。Scoped_ptr本人使用的较少,只是在创建线程对象的时候使用,正好符合不能复制的语义。使用shared_ptr和weak_ptr的示例代码:

 

class monster_t
{
protected:
    weak_ptr<player_t> m_attack;
    shared_ptr<player_t> get_attack()
    {
        return shared_ptr<player_t>(m_attack);
    }
public:
    void handle_ai()
    {
        shared_ptr<player_t> attack = get_attack();
        if (attack)
        {
            int x = attack->get_x();
        }
    }
}

 

有人问monster_t为什么不直接使用shared_ptr,如果使用shared_ptr就不符合现实的模型了,monster_t显然不应该控制player_t的生命周期,如果使用了shared_ptr,那么可能导致player_t被延迟析构,甚至会导致内存暴涨。这也是shared_ptr的使用误区,所以本人建议尽量shared_ptr和weak_ptr结合用,否则野指针问题解决了,内存泄漏问题又来了。

内存泄漏:

野指针问题可以通过采用良好的编程范式,尽量规避,但总计c++规避内存泄漏的方法却很为难,简单而言尽量保证对象的分配和释放(分别)是单个入口的,这样大部分问题都可以拦截在code review阶段。那么怎么检测内存泄漏呢?

首先说明本方法区别于valgrind等工具,该工具是调试期进行的检测,本文探究的是运行期的检测,确切说是运行期定时输出所有对象的数量到日志中。

首先定义分配、释放对象的接口:

template<typename T>
T* new_obj()
{
    T* p = new T();
    singleton_t<obj_counter_t<T> >::instance().inc(1);
    return p;
}

template<typename T, typename ARG1>
T* new_obj(ARG1 arg1)
{
    T* p = new T(arg1);
    singleton_t<obj_counter_t<T> >::instance().inc(1);
    return p;
}

template<typename T, typename ARG1, typename ARG2>
T* new_obj(ARG1 arg1, ARG2 arg2)
{
    T* p = new T(arg1, arg2);
    singleton_t<obj_counter_t<T> >::instance().inc(1);
    return p;
}
template<typename T>
T* new_array(int n)
{
    T* p = new T[n];
    singleton_t<obj_counter_t<T> >::instance().inc(n);
    return p;
}

 

为了节省篇幅,这里只列举了三种构造的代码,当分配对象时,对应的类型数量增加1,obj_counter 使用原子操作为每一种类型记录其数量。

class obj_counter_i
{
public:
    obj_counter_i():m_ref_count(0){}
    virtual ~ obj_counter_i(){}
    void inc(int n) { (void)__sync_add_and_fetch(&m_ref_count, n); }
    void dec(int n) { __sync_sub_and_fetch(&m_ref_count, n);        }
    long val() const{ return m_ref_count;                            }

    virtual string get_name() { return ""; }
protected:
    volatile long m_ref_count;
};
template<typename T>
class obj_counter_t: public obj_counter_i
{
    obj_counter_t()
    {
        singleton_t<obj_counter_t<T> >::instance().reg(this);
    }
    virtual string get_name() { return TYPE_NAME(T); }
};

 

相应的当对象被释放的时候,对应的对象数量减一,示例代码如下:

template<typename T>
void del_obj(T* p)
{
    if (p)
    {
        delete p;
        singleton_t<obj_counter_t<T> >::instance().dec(1);
    }
}

 

这样就做到了所有的对象的数量都被记录了,可以定时的将对象数量输出到文件:

class obj_counter_summary_t
{
public:
    void reg(obj_counter_i* p)
    {
        m_all_counter.push_back(p);
    }

    map<string, long> get_all_obj_num()
    {
        map<string, long> ret;
        for (list<obj_counter_i*>::iterator it = m_all_counter.begin(); it != m_all_counter.end(); ++it)
        {
            ret.insert(make_pair((*it)->get_name(), (*it)->val()));
        }
        return ret;
    }

    void dump(const string& path_)
    {
        ofstream tmp_fstream;
        tmp_fstream.open(path_.c_str());
        map<string, long> ret = get_all_obj_num();
        map<string, long>::iterator it = ret.begin();

        time_t timep   = time(NULL);
        struct tm *tmp = localtime(&timep);

        char tmp_buff[256];
        sprintf(tmp_buff, "%04d%02d%02d-%02d:%02d:%02d",
                tmp->tm_year + 1900, tmp->tm_mon + 1, tmp->tm_mday,
                tmp->tm_hour, tmp->tm_min, tmp->tm_sec);
        char buff[1024] = {0};

        snprintf(buff, sizeof(buff), "obj,num,%s\n", tmp_buff);
        tmp_fstream << buff;

        for (; it != ret.end(); ++it)
        {
            snprintf(buff, sizeof(buff), "%s,%ld\n", it->first.c_str(), it->second);
            tmp_fstream << buff;
        }

        tmp_fstream.flush();
    }
protected:
    list<obj_counter_i*>    m_all_counter;
};

 

 

输出的文件格式为csv格式,方便进一步做数据分析。可以使用我开发的小工具格式化csv数据。url:http://ffown.sinaapp.com/perf/csv.html

文件内容data:

obj,num,20120606-17:01:41
dumy,1111
foo,222
obj,num,20120606-18:01:41
dumy,11311
foo,2422
obj,num,20120606-19:01:41
dumy,41111
foo,24442

总结:

  • 野指针可以使用shared_ptr和weak_ptr结合使用来尽量规避。
  • 使用shared_ptr要尽量小心,否则可能导致对象无法释放,导致内存泄漏。
  • 可以定时输出当前所有对象的数量,来分析是否有内存泄漏,或者内存泄漏是有哪些对象引起的。
  • 本文介绍了记录所有对象的方法,除了可以分析内存泄漏外,也不失为数据分析的一种方法。需要注明的是,本方法不能替代valgrind工具,二者作用不同。
  • TYPE_NAME 的实现参考

  https://ffown.googlecode.com/svn/trunk/fflib/include/type_i.h

    全部示例代码:https://ffown.googlecode.com/svn/trunk/fflib/include/obj_tool.h

目录
相关文章
|
2月前
|
缓存 安全 编译器
C++面试周刊(3):面试不慌,这样回答指针与引用,青铜秒变王者
《C++面试冲刺周刊》第三期聚焦指针与引用的区别,从青铜到王者级别面试回答解析,助你21天系统备战,直击高频考点,提升实战能力,轻松应对大厂C++面试。
332 131
C++面试周刊(3):面试不慌,这样回答指针与引用,青铜秒变王者
|
2月前
|
存储 C++
C++语言中指针变量int和取值操作ptr详细说明。
总结起来,在 C++ 中正确理解和运用 int 类型地址及其相关取值、设定等操纵至关重要且基础性强:定义 int 类型 pointer 需加星号;初始化 pointer 需配合 & 取址;读写 pointer 执向之处需配合 * 解引用操纵进行。
169 12
|
3月前
|
安全 C语言 C++
比较C++的内存分配与管理方式new/delete与C语言中的malloc/realloc/calloc/free。
在实用性方面,C++的内存管理方式提供了面向对象的特性,它是处理构造和析构、需要类型安全和异常处理的首选方案。而C语言的内存管理函数适用于简单的内存分配,例如分配原始内存块或复杂性较低的数据结构,没有构造和析构的要求。当从C迁移到C++,或在C++中使用C代码时,了解两种内存管理方式的差异非常重要。
130 26
|
8月前
|
存储 程序员 编译器
玩转C++内存管理:从新手到高手的必备指南
C++中的内存管理是编写高效、可靠程序的关键所在。C++不仅继承了C语言的内存管理方式,还增加了面向对象的内存分配机制,使得内存管理既有灵活性,也更加复杂。学习内存管理不仅有助于提升程序效率,还有助于理解计算机的工作原理和资源分配策略。
|
4月前
|
C语言 C++
c与c++的内存管理
再比如还有这样的分组: 这种分组是最正确的给出内存四个分区名字:栈区、堆区、全局区(俗话也叫静态变量区)、代码区(也叫代码段)(代码段又分很多种,比如常量区)当然也会看到别的定义如:两者都正确,记那个都选,我选择的是第一个。再比如还有这样的分组: 这种分组是最正确的答案分别是 C C C A A A A A D A B。
64 1
|
10月前
|
存储 缓存 编译器
【硬核】C++11并发:内存模型和原子类型
本文从C++11并发编程中的关键概念——内存模型与原子类型入手,结合详尽的代码示例,抽丝剥茧地介绍了如何实现无锁化并发的性能优化。
408 68
|
7月前
|
存储 Linux C语言
C++/C的内存管理
本文主要讲解C++/C中的程序区域划分与内存管理方式。首先介绍程序区域,包括栈(存储局部变量等,向下增长)、堆(动态内存分配,向上分配)、数据段(存储静态和全局变量)及代码段(存放可执行代码)。接着探讨C++内存管理,new/delete操作符相比C语言的malloc/free更强大,支持对象构造与析构。还深入解析了new/delete的实现原理、定位new表达式以及二者与malloc/free的区别。最后附上一句鸡汤激励大家行动缓解焦虑。
|
8月前
|
存储 缓存 C++
C++ 容器全面剖析:掌握 STL 的奥秘,从入门到高效编程
C++ 标准模板库(STL)提供了一组功能强大的容器类,用于存储和操作数据集合。不同的容器具有独特的特性和应用场景,因此选择合适的容器对于程序的性能和代码的可读性至关重要。对于刚接触 C++ 的开发者来说,了解这些容器的基础知识以及它们的特点是迈向高效编程的重要一步。本文将详细介绍 C++ 常用的容器,包括序列容器(`std::vector`、`std::array`、`std::list`、`std::deque`)、关联容器(`std::set`、`std::map`)和无序容器(`std::unordered_set`、`std::unordered_map`),全面解析它们的特点、用法
C++ 容器全面剖析:掌握 STL 的奥秘,从入门到高效编程
|
8月前
|
存储 机器学习/深度学习 编译器
【C++终极篇】C++11:编程新纪元的神秘力量揭秘
【C++终极篇】C++11:编程新纪元的神秘力量揭秘
|
8月前
|
安全 C语言 C++
彻底摘明白 C++ 的动态内存分配原理
大家好,我是V哥。C++的动态内存分配允许程序在运行时请求和释放内存,主要通过`new`/`delete`(用于对象)及`malloc`/`calloc`/`realloc`/`free`(继承自C语言)实现。`new`分配并初始化对象内存,`delete`释放并调用析构函数;而`malloc`等函数仅处理裸内存,不涉及构造与析构。掌握这些可有效管理内存,避免泄漏和悬空指针问题。智能指针如`std::unique_ptr`和`std::shared_ptr`能自动管理内存,确保异常安全。关注威哥爱编程,了解更多全栈开发技巧。 先赞再看后评论,腰缠万贯财进门。
350 0