进程守护系统,你懂吗?-阿里云开发者社区

开发者社区> zhuweisky> 正文

进程守护系统,你懂吗?

简介: 1.什么是进程守护系统?     进程守护系统,用于监控指定的进程,当发现目标进程不再正常工作时,就关闭该进程,并重启它。   在什么情况下使用进程守护系统了?比如说,我们的某个服务器软件,在上线后出现一个严重的bug,该bug虽然很难出现,但是只要一出现,整个服务都会停掉(进程没有崩溃,只是不再提供服务)。
+关注继续查看

1.什么是进程守护系统?  

  进程守护系统,用于监控指定的进程,当发现目标进程不再正常工作时,就关闭该进程,并重启它。

  在什么情况下使用进程守护系统了?比如说,我们的某个服务器软件,在上线后出现一个严重的bug,该bug虽然很难出现,但是只要一出现,整个服务都会停掉(进程没有崩溃,只是不再提供服务)。此时,重启服务软件,又会开始正常工作。

  对于这样严重的bug,必须要查清楚并解决掉的。但是,基于以下两个原因:

(1)系统已经对用户开放,服务不能停。不可能说系统先下线,直到bug被解决掉后再重新上线。

(2)bug很难重现,可能需要加日志,不断地跟踪排查,这很可能是一场持久战。

   为了让系统继续线上运行,在bug解决之前,必须要保证系统停止服务之后,能迅速重新启动恢复服务。此时,使用进程守护系统是最恰当不过的了。

   OrayGuard就是为达到这一目的,实现了一个进程守护系统。一个守护者程序,可以守护同一台机器上的多个进程。

  

 

2.进程守护系统的实现及使用

   OrayGuard守护者对被守护进程的管理使用的是心跳机制,其原理描述如下:

(1)被守护进程定时向守护者报告(发送心跳),以表明自己是在正常提供服务。

(2)如果守护者发现某个被守护进程连续一段时间都没有心跳过来,就关闭对应的进程,然后再启动对应的程序。

  在OrayGuard系统中,为了方便使用,已经做了很多工作,直接提供如下设施给使用者。

(1)在守护者这一方:提供了可直接运行的exe,双击即可运行起来。

(2)在被守护进程这一方:提供了OrayGuard.Core.dll,使用者只要调用其中的GuardianProxy静态类的几个方法,即可完成所有工作。 

    /// <summary>
    /// 与守护服务进行通信的Proxy,提供给被守护进程直接使用。
    /// </summary>
    public static class GuardianProxy
    {     /// <summary>
        /// 初始化Proxy,并向守护服务注册当前进程。
        /// </summary>
        /// <param name="guardServerPort">守护进程提供服务的Port</param>
        /// <param name="timeoutInSecs">超时间隔。单位:秒</param>
        public static void Initialize(int guardServerPort, int timeoutInSecs);

        /// <summary>
        /// 向守护服务激活当前进程一次。
        /// </summary>
        public static void Activate();

        /// <summary>
        /// 向守护服务注销当前进程。
        /// </summary>
        public static void Dispose();
    }

   在被守护方:

(1)进程启动时,调用GuardianProxy的Initialize方法,即可向守护者注册当前进程。(端口号就填守护者配置文件中设定的端口)

(2)进程内需要定时(比如10秒一次)检测自己是否仍在正常提供服务,如果是,则调用GuardianProxy的Activate方法,向守护者发送心跳。

(3)当进程正常退出时,调用GuardianProxy的Dispose方法向守护者注销。

 

 3.Demo以及下载

  最后,我们编写了一个用于演示的被守护进程的项目,整个系统运行起来后,效果如下:

      

   (注意:实际测试时,不要调试,而是要双击演示项目debug目录下的TestProcess.exe运行演示,否则,模拟故障后,演示进程会被关闭,但是无法被重启。因为,调试时,检测到的是TestProcess.vshost.exe)

   下载 OrayGuard。压缩包中包含如下内容:

(1)OrayGuard守护者:可直接运行的守护者程序。

(2)SDK:供被守护进程使用的SDK。

(3)TestProcess:用于演示的被守护进程的项目源码。

  

 更多分享:打通B/S与C/S !让HTML5 WebSocket与.NET Socket公用同一个服务端!

 

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
linux usb枚举过程分析之守护进程及其唤醒【转】
转自:http://blog.csdn.net/xuelin273/article/details/38646765 usb热插拔,即usb设备可以实现即插即用,像U盘一样,插到电脑里就可以用,不用时可以直接拔除,这个动作不会影响USB设备使用性能。
1153 0
Linux 命令详解(六)Linux 守护进程的启动方法
Linux 守护进程的启动方法 http://www.ruanyifeng.com/blog/2016/02/linux-daemon.html
771 0
linux strace-跟踪进程的系统调用或是信号产生情况,lstrace-跟踪己丑年调用库函数情况,进程跟踪调试命令
本工具可以用来做大多数排除,比如mount一个NFS,很慢,找不出原因,我们可以使用strace命令来跟中mount这个经常所有的调用过程。 strace 命令是一种强大的工具,它能够显示所有由用户空间程序发出的系统调用。
1377 0
15、深入理解计算机系统笔记:进程控制
1、获取进程ID[1] 每个进程都有一个唯一的正数(非0)进程ID(PID)。 示例代码 #include #include pid t getpid(void); pid t getppid(void); returns: PID of either the caller...
651 0
Ubuntu系统进程绑定CPU核
版权声明:本文为博主chszs的原创文章,未经博主允许不得转载。 https://blog.csdn.net/chszs/article/details/47278019 Ubuntu系统进程绑定CPU核 作者:chszs,版权所有,未经同意,不得转载。
826 0
+关注
zhuweisky
从事软件开发行业十多年,专注于网络通信技术和网络语音视频技术,擅长系统架构设计、系统性能优化等。zhuweisky.cnblogs.com
300
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
《Nacos架构&原理》
立即下载
《看见新力量:二》电子书
立即下载
云上自动化运维(CloudOps)白皮书
立即下载