Kill - 9 or 15 解析

本文涉及的产品
全局流量管理 GTM,标准版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
云解析 DNS,旗舰版 1个月
简介: 一提到“Kill”命令,大家是不是很兴奋,潜意识觉得自己大展宏图之刻即将到来,仿佛自己就是那个黑暗的夜空下拿着长剑的武士,站在高高的山崖顶层,xx一切。。。别,醒醒吧,孩子(大侠)!大家在停止Java进程时(当然,不仅仅是Java,其他应用也同样适用,本文主要针对Java程序进行解析),有没有想过为什么要用kill -9呢?这样操作对吗?

      一提到“Kill”命令,大家是不是很兴奋,潜意识觉得自己大展宏图之刻即将到来,仿佛自己就是那个黑暗的夜空下拿着长剑的武士,站在高高的山崖顶层,xx一切。。。别,醒醒吧,孩子(大侠)!大家在停止Java进程(当然,不仅仅是Java,其他应用也同样适用,本文主要针对Java程序进行解析),有没有想过为什么要用kill -9呢?这样操作对吗?

      Kill 命令很容易让人产生误解,以为它仅仅就是用来杀死进程的,就像汉语有句话“我喜欢上你”,如果不针对具体的应用场景的话,会出问题的。言归正传,我们来看一下 man page 对它的解释:Kill - send a signal to a process。

     从官方的解释可以看出:Kill 的本意是向进程发送信号的命令。当然我们可以向进程发送一个终止运行的信号,此时的 Kill 命令才是名至实归。事实上如果我们不给 Kill 命令传递信号参数,它默认传递终止进程运行的信号给进程!这是 Kill 命令最主要的用法,也是本文要重点解析的内容。

     一般情况下,终止一个前台进程使用 Ctrl + C 就可以了。对于一个后台进程大部分就只能需要借助 Kill 命令来实施了。

      我们先看个场景,代码功能为使用Timer模拟一个工作线程,该线程重复工作20次,并输出相关信息,简单代码如下所示:


package com.cn.luga.java.lang;
import java.util.Timer;
import java.util.TimerTask;
import java.util.concurrent.atomic.AtomicInteger;
/**
 * Date: 30-1-21
 * Time: 11:01
 */
public class TestShutdownHook {
    //简单模拟工作
    static Timer timer = new Timer("work-timer");
    //计数工作次数
    static AtomicInteger count = new AtomicInteger(0);
    /**
     * hook线程
     */
    static class CleanWorkThread extends Thread{
        @Override
        public void run() {
            System.out.println("clean some work.");
            timer.cancel();
            try {
                Thread.sleep(2 * 1000);//sleep 2s
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
        }
    }
    public static void main(String[] args) throws InterruptedException {
        //将hook线程添加到运行时环境中去
        Runtime.getRuntime().addShutdownHook(new CleanWorkThread());
        System.out.println("main class start ..... ");
        //简单模拟
        timer.schedule(new TimerTask() {
            @Override
            public void run() {
                count.getAndIncrement();
                System.out.println("doing work " + count);
                if (count.get() == 20) {  //工作20次退出
                    System.exit(0);
                }
            }
        }, 0, 2 * 1000);
    }
}

      通过上述代码,我们看到上述程序中存在System.exit()方法,意味着,可以借助此方法进行进程的关闭,如果我们强行进行kill -9操作的话,此应用程序会抛异常的,如果是在实际的业务场景,可能会导致数据丢失,业务异常。因为如果直接使用kill -9 pid,JVM注册的钩子不会被调用的。

     JDK在1.3之后提供了Java Runtime.addShutdownHook(Thread hook)方法,可以注册一个JVM关闭的钩子,其参数语法如下:

      hook -- 一个初始化但尚未启动的线程对象,注册到JVM钩子的运行代码。
     IllegalArgumentException -- 如果指定的钩已被注册,或如果它可以判定钩已经运行或已被运行。
      IllegalStateException -- 如果虚拟机已经是在关闭的过程中。

  SecurityException -- 如果存在安全管理器并且它拒绝的RuntimePermission“shutdownHooks”)。

     我们来看下Kill命令的相关源码,Kill是用户进程发送信号的系统调用,它的系统服务例程为sys_kill。sys_kill其中siginfo结构在include\asm-i386\siginfo.h之中,该文件中只有一个include,所以真正的定义在include\asm-generic\siginfo.h中。

     sys_kill调用了kill_something_info函数,具体可参考源码所示:


static int kill_something_info(int sig, struct siginfo *info, int pid)
{
    if (!pid) {
        return kill_pg_info(sig, info, process_group(current));
    } else if (pid == -) {
        int retval = , count = ;
        struct task_struct * p;
        read_lock(&tasklist_lock);
        for_each_process(p) {
            if (p->pid >  && p->tgid != current->tgid) {
                int err = group_send_sig_info(sig, info, p);
                ++count;
                if (err != -EPERM)
                    retval = err;
            }
        }
        read_unlock(&tasklist_lock);
        return count ? retval : -ESRCH;
    } else if (pid < ) {
        return kill_pg_info(sig, info, -pid);
    } else {
        return kill_proc_info(sig, info, pid);
    }
}

      基于kill_something_info,从该函数中,我们可以看到kill系统调用的pid参数的规则及其代表的意义,具体如下:

  • pid>0      将此信号发送给进程ID为pid的进程组
  • pid==0    将此信号发送给同组所有进程
  • pid<0      将此信号发送给组ID为-pid的进程
  • pd==-1   将此信号发送给系统所有的进程

     下面我们看下kill_something_info里面的具体函数,在前面的kill_something_info中涉及的kill_pg_info函数,表示将信号发送到一个组,该函数第3个参数为组id。具体如下:


int
kill_pg_info(int sig, struct siginfo *info, pid_t pgrp)
{
    int retval;
    read_lock(&tasklist_lock);
    retval = __kill_pg_info(sig, info, pgrp);
    read_unlock(&tasklist_lock);
    return retval;
}

      可以看到,在加锁之后,简单调用了__kill_pg_info函数,具体如下:


int __kill_pg_info(int sig, struct siginfo *info, pid_t pgrp)
{
    struct task_struct *p = NULL;
    int retval, success;
    if (pgrp <= )
        return -EINVAL;
    success = ;
    retval = -ESRCH;
    do_each_task_pid(pgrp, PIDTYPE_PGID, p) {
        int err = group_send_sig_info(sig, info, p);
        success |= !err;
        retval = err;
    } while_each_task_pid(pgrp, PIDTYPE_PGID, p);
    return success ?  : retval;
}

     其中do_each_task_pid宏和while_each_task_pid宏位于include\linux\pid.h之中,同时该文件中有pid_type枚举类型等,和kernel\pid.c文件一起,包含着pid的相关内容。再具体的内容这里不再赘述,大家可去查看相关源码。

      kill_something_info函数的kill_pg_info所涉及的内容较多,本文暂列出部分。我们接下来看kill_proc_info函数,其加锁之后调用了group_send_sig_info函数,具体如下:


int
kill_proc_info(int sig, struct siginfo *info, pid_t pid)
{
    int error;
    int acquired_tasklist_lock = ;
    struct task_struct *p;
    rcu_read_lock();
    if (unlikely(sig_needs_tasklist(sig))) {
        read_lock(&tasklist_lock);
        acquired_tasklist_lock = ;
    }
    p = find_task_by_pid(pid);
    error = -ESRCH;
    if (p)
        error = group_send_sig_info(sig, info, p);
    if (unlikely(acquired_tasklist_lock))
        read_unlock(&tasklist_lock);
    rcu_read_unlock();
    return error;
}

      关于到底是Kill -9 还是Kill -15,以下为简要对比解析:


[administrator@JavaLangOutOfMemory ~ ]% Kill -15

      被称为优雅的退出。当使用kill -15时,系统会发送一个SIGTERM的信号给对应的程序。当程序接收到该信号后,具体要如何处理是应用程序自己可以决定的。可以选择:

       1、立即停止程序

       2、释放响应资源后停止程序

       3、忽略该信号,继续执行程序

      因为kill -15信号只是通知对应的进程要进行"安全、干净的退出",程序接到信号之后,退出前一般会进行一些"准备工作",如资源释放、临时文件清理等等,如果准备工作做完了,再进行程序的终止。但是,如果在"准备工作"进行过程中,遇到阻塞或者其他问题导致无法成功,那么应用程序可以选择忽略该终止信号。

      这也就是为什么我们有的时候使用kill命令是没办法"杀死"应用的原因,因为默认的kill信号是SIGTERM(15),而SIGTERM(15)的信号是可以被阻塞和忽略的。

      大部分程序接收到SIGTERM信号后,会先释放自己的资源,然后在停止。但是也有程序可以在接受到信号量后,做一些其他的事情,并且这些事情是可以配置的。如果程序正在等待IO,可能就不会立马做出相应,或者等待其他项目的响应。


[administrator@JavaLangOutOfMemory ~ ]% Kill -9

      与kill -15相比,kill -9就相对强硬一点,系统会发出SIGKILL信号,他要求接收到该信号的程序应该立即结束运行,不能被阻塞或者忽略。

      所以,相比于kill -15命令,kill -9在执行时,应用程序是没有时间进行"准备工作"的,所以这通常会带来一些副作用,数据丢失或者终端无法恢复到正常状态等。

      那么在实际的业务场景中,如何停掉Java应用进程呢?下面给出些建议:

      1、尽可能用应用框架提供的服务操作命令,例如,针对Tomcat Web容器,我们可以编写脚本触发其shutdown.sh命令。

      2、借助Shell调用ShutdownHook方法,如果无法判断直接Kill -9对杀死进程有没有影响的条件下。

      3、若此应用服务进程调用较为单一,在合适的时刻,优先使用Kill -15,实在不行再考虑Kill -9。

相关文章
|
Web App开发 关系型数据库 MySQL
mysql 协议的process kill包及解析
git https://github.com/sea-boat/mysql-protocol 概况 mysql客户端可以用process kill命令让服务端终止某个连接,正常会返回ok包。
1081 0
|
2月前
|
监控 网络协议 Java
Tomcat源码解析】整体架构组成及核心组件
Tomcat,原名Catalina,是一款优雅轻盈的Web服务器,自4.x版本起扩展了JSP、EL等功能,超越了单纯的Servlet容器范畴。Servlet是Sun公司为Java编程Web应用制定的规范,Tomcat作为Servlet容器,负责构建Request与Response对象,并执行业务逻辑。
Tomcat源码解析】整体架构组成及核心组件
|
2月前
|
存储 NoSQL Redis
redis 6源码解析之 object
redis 6源码解析之 object
58 6
|
21天前
|
存储 缓存 Java
什么是线程池?从底层源码入手,深度解析线程池的工作原理
本文从底层源码入手,深度解析ThreadPoolExecutor底层源码,包括其核心字段、内部类和重要方法,另外对Executors工具类下的四种自带线程池源码进行解释。 阅读本文后,可以对线程池的工作原理、七大参数、生命周期、拒绝策略等内容拥有更深入的认识。
什么是线程池?从底层源码入手,深度解析线程池的工作原理
|
25天前
|
开发工具
Flutter-AnimatedWidget组件源码解析
Flutter-AnimatedWidget组件源码解析
|
21天前
|
设计模式 Java 关系型数据库
【Java笔记+踩坑汇总】Java基础+JavaWeb+SSM+SpringBoot+SpringCloud+瑞吉外卖/谷粒商城/学成在线+设计模式+面试题汇总+性能调优/架构设计+源码解析
本文是“Java学习路线”专栏的导航文章,目标是为Java初学者和初中高级工程师提供一套完整的Java学习路线。
176 37
|
13天前
|
编解码 开发工具 UED
QT Widgets模块源码解析与实践
【9月更文挑战第20天】Qt Widgets 模块是 Qt 开发中至关重要的部分,提供了丰富的 GUI 组件,如按钮、文本框等,并支持布局管理、事件处理和窗口管理。这些组件基于信号与槽机制,实现灵活交互。通过对源码的解析及实践应用,可深入了解其类结构、布局管理和事件处理机制,掌握创建复杂 UI 界面的方法,提升开发效率和用户体验。
64 12
|
2月前
|
测试技术 Python
python自动化测试中装饰器@ddt与@data源码深入解析
综上所述,使用 `@ddt`和 `@data`可以大大简化写作测试用例的过程,让我们能专注于测试逻辑的本身,而无需编写重复的测试方法。通过讲解了 `@ddt`和 `@data`源码的关键部分,我们可以更深入地理解其背后的工作原理。
30 1
|
2月前
|
开发者 Python
深入解析Python `httpx`源码,探索现代HTTP客户端的秘密!
深入解析Python `httpx`源码,探索现代HTTP客户端的秘密!
72 1
|
2月前
|
开发者 Python
深入解析Python `requests`库源码,揭开HTTP请求的神秘面纱!
深入解析Python `requests`库源码,揭开HTTP请求的神秘面纱!
132 1

热门文章

最新文章

推荐镜像

更多
下一篇
无影云桌面