重学Node系列04-进程及集群相关

简介: 创建进程相信大家耳边听烂的一句话就是“JavaScript是单线程的”,为了弥补面对单线程对多核使用不足的问题,node很方便的提供了几个创建进程的方法:

Node进程及集群相关

创建进程


相信大家耳边听烂的一句话就是“JavaScript是单线程的”,为了弥补面对单线程对多核使用不足的问题,node很方便的提供了几个创建进程的方法:

  • spawn():启动一个子进程来执行命令
  • exec():启动一个子进程来执行命令,与spawn()不同的是其接口不同,它有一个回调函数获知子进程的状况
  • execFile():启动一个子进程来执行可执行文件
  • fork():与spawn()类似,不同点在于它创建node的子进程只需指定要执行的JavaScript文件模块即可

spawn()exec()execFile()不同的是,后两者创建时可以指定timeout属性设置超时时间,一旦创建的进程超过设定的时间将会被杀死;

exec()execFile()不同的是,exec()适合执行已有的命令,execFile()适合执行文件;

类型 回调/异常 进程类型 执行类型 可设置超时时间
spawn() × 任意 命令 ×
exec() 任意 命令
execFile() 任意 可执行文件
fork() × Node JavaScript文件 ×

一般来说创建多线程只是为了充分将CPU资源利用起来,在做服务端时,事件驱动的机制已经可以很好的解决大并发的问题了,注意和每请求/每进程的服务端模型区分

Node多进程架构


经典的主从模式:

  • 主进程不负责具体的业务处理,而是负责调度或管理工作进程,它是趋于稳定的
  • 工作进程负责具体的业务处理

比如我们这里编写一个经典的代码试试:

这里主进程中查询了当前机器cpu的核心数,根据不同的核心数复制对应数量的工作进程,从而真正利用到多核CPU的优势,当然由于我这台服务器只有单核,所以这里只开出了一个子进程,这里假设有8核的话就是如下效果:

当然,这是个反面例子,因为我们本来就是要利用多核CPU的性能才开出多个进程,而这里在单核CPU上开出8个进程是没用的,反而调度器还要来回切换进程进行处理,因为操作系统有句经典的话就是“宏观上并发执行,微观上交替执行”,所以我这里这样做是没用的,只是为了演示。

进程通信原理


这里先复习一下操作系统中进程通信的方式详细链接详细链接

  • 共享内存通信方式
  • 消息传递通信方式(利用操作系统提供的消息传递系统实现进程通信)
  • 消息缓冲通信方式:直接通信方式
  • 信箱通信方式:间接通信方式,对同步的要求没那么严格
  • 共享文件通信方式:管道通信方式

除此之外,还有一些其他的通信方式比如:

  • 信号量通信,传递的信息较少
  • 套接字通信

node是通过管道技术实现的,当然这个管道与上述中的管道有所区别,是在node中的一个抽象层面,具体在windows中是用命名管道,linux使用unix domain socket实现的,最终体现出现就是进程之间创建IPC通道,通过这个通道,进程之间才能通过messagesend()传递消息

细节上:

  • 父进程在实际创建子进程之前,会创建IPC通道并监听它,然后才真正创建出子进程,并通过环境变量(NODE_CHANNEL_FD)告诉子进程这个IPC通道的文件描述符
  • 子进程在启动的过程中,根据文件描述符去链接这个已存在的IPC通道,从而完成父子进程之前的连接(创建的子进程为node进程默认为遵守这个约定,而非node进程的要么自实现遵守约定,要么不能通信)
  • IPC通道被抽象为Stream对象,在调用send()时发送数据(类似于write()),接收到的消息会通过message事件(类似于data)触发给应用层

多个进程监听相同的端口


1. 首先是为什么要让多个进程来监听相同的端口

因为我们要使用主从模式,使不同的工作线程来处理同一个应用,但是操作系统中,一般来说都是一个端口对应一个进程即一个应用

⚠如何不做任何处理,直接让多个进程监听同一个端口是会报错的

2. 那为什么不能使用如下这种方法呢?

我们在使用主从模式的时候,可以使用主进程来监听主端口(如80),即主进程对外接收所有的网络请求,再将这些请求分别代理到不同的端口的进程上

答:

通过代理,虽然可以避免端口不能被重复监听的问题,甚至可以在代理进程上做适当的负载均衡,使得每个子进程可以较为均衡地执行任务。

但是由于进程每接收到一个连接,就会用掉一个文件描述符,因此代理方案中客户端连接到代理进程需要消耗,代理进程连接到工作进程这两个阶段需要消耗掉两个文件描述符。而操作系统地文件描述符是有限地,代理方案浪费了一倍数量地文件描述符影响了系统的扩展能力

3. 那该如何解决呢?

node中还存在发送句柄的操作,句柄是一种可以用来标识资源的引用,因此我们可以直接在主进程收到socket请求后,将这个socket通过send()方法发送给工作进程,而不是代理方案中的与工作进程重新建立新的socket连接,是通过IPC进程通信方式直接发送句柄,同时我们将socket发送给了子进程之后,主进程自己也可以关闭监听,之后由子进程来处理请求,这样最终效果就变为了“多个进程监听相同的端口”但不报错。

// 主进程
const child = require('child_process').fork('child.js');
const child1 = cp.fork('child.js');
const child2 = cp.fork('child.js');
// Open up the server object and send the handle
const server = require('net').createServer();
server.listen(1337, function () {
  child1.send('server', server);
  child2.send('server', server);
  // 关掉主进程的监听,让子进程来处理这些请求
  server.close();
});
// 工作进程
const http = require('http');
const server = http.createServer(function (req, res) {
  res.writeHead(200, {'Content-Type': 'text/plain'});
  res.end('handled by child, pid is ' + process.pid + '\n');
});
process.on('message', function (m, tcp) {
  if (m === 'server') {
    tcp.on('connection', function (socket) {
      server.emit('connection', socket);
    });
  }
});


最终发送到IPC通道的信息都是字符串,刚才上述代码发送的其实是句柄文件描述符,是一个整数,send()方法会将原始信息结合其他信息包装为一个对象并序列化为字符串传递过去,另一边再JSON.parse()就可以了

集群稳定


子进程的相关事件快速入口

自动重启

通过监听子进程的exit事件来获知其退出的信息,然后做一些操作,比如重启一个工作进程来继续服务:

// master.js
const fork = require('child_process').fork;
const cpus = require('os').cpus();
const server = require('net').createServer();
server.listen(1337);
const workers = {};
const createWorker = function () {
  const worker = fork(__dirname + '/worker.js');
  // 退出时重新启动新的进程
  worker.on('exit', function () {
    console.log('Worker ' + worker.pid + ' exited.');
    delete workers[worker.pid];
    createWorker();
  });
  // 句柄转发
  worker.send('server', server);
  workers[worker.pid] = worker;
  console.log('Create worker. pid: ' + worker.pid);
};
for (let i = 0; i < cpus.length; i++) {
  createWorker();
}
// 进程自己退出时,让所有工作进程退出
process.on('exit', function () {
  for (let pid in workers) {
    workers[pid].kill();
  }
});


缺点,上述代码是在子进程退出后重启的新进程来处理请求,这中间有一段空白期,我们应该在子进程退出前就启动的新的工作进程从而实现平滑重启

// worker.js
process.on('uncaughtException', function (err) {
  process.send({ act: 'suicide' });
  // 停止接收新的连接
  worker.close(function () {
    // 所有已有连接断开后,退出进程
    process.exit(1);
  });
  // 设个超时自动断开,避免长连接断开需要较久的时间
  setTimeout(function () {
    process.exit(1);
  }, 5000);
});


const createWorker = function () {
  const worker = fork(__dirname + '/worker.js');
  // 启动新的进程
  worker.on('message', function (message) {
    if (message.act === 'suicide') {
      createWorker();
    }
  });
  worker.on('exit', function () {
    console.log('Worker ' + worker.pid + ' exited.');
    delete workers[worker.pid];
  });
  worker.send('server', server);
  workers[worker.pid] = worker;
  console.log('Create worker. pid: ' + worker.pid);
};


当业务代码本来就有严重的问题,无论重启多少次都会报错,我们应该有合适的策略放弃重启,比如单位时间内只能重启有限次数,否则就放弃(最好需要添加日志、报警等):

// 重启次数
const limit = 10;
// 时间单位
const during = 60000;
const restart = [];
const isTooFrequently = function () {
  // 记录重启时间
  const time = Date.now();
  const length = restart.push(time);
  if (length > limit) {
    // 取出最后10个记录
    restart = restart.slice(limit * -1);
  }
  // 最后一次重启到前10次重启之间的时间间隔
  return restart.length >= limit && restart[restart.length - 1] - restart[0] < during;
};
const workers = {};
const createWorker = function () {
  // 检查是否太过频繁
  if (isTooFrequently()) {
    // 触发giveup事件后,不再重启
    process.emit('giveup', length, during);
    return;
  }
  const worker = fork(__dirname + '/worker.js');
  worker.on('exit', function () {
    console.log('Worker ' + worker.pid + ' exited.');
    delete workers[worker.pid];
  });
  // 重新启动新的进程
  worker.on('message', function (message) {
    if (message.act === 'suicide') {
      createWorker();
    }
  });
  // 句柄转发
  worker.send('server', server);
  workers[worker.pid] = worker;
  console.log('Create worker. pid: ' + worker.pid);
};


负载均衡

合理分配任务,避免单方面忙碌和单方面空闲

常见的策略如下:

  1. 轮询:每个请求按时间顺序逐一分配到不同的后端服务器,如果后端服务器down掉,能自动剔除。
  2. 指定权重:指定轮询几率,weight和访问比率成正比,用于后端服务器性能不均的情况。
  3. IP绑定 ip_hash:每个请求按访问ip的hash结果分配,这样每个访客固定访问一个后端服务器,可以解决session的问题。
  4. fair(第三方):按后端服务器的响应时间来分配请求,响应时间短的优先分配。
  5. url_hash(第三方):按访问url的hash结果来分配请求,使每个url定向到同一个后端服务器,后端服务器为缓存时比较有效。

状态共享


解决数据共享最直接、简单的方式就是通过第三方来进行数据存储,然后单独使用一个进程来轮询获取数据,并主动通知给各个工作线程

Cluster模块


刚才进程之间的管理都是我们自己手动写的,其实node有很方便的cluster模块,用以解决多核CPU的利用率问题,同时也了较完善的API,用以处理进程的健壮性问题。


目录
相关文章
|
28天前
|
存储 Kubernetes 容器
【CKA模拟题】查找集群中使用内存最高的node节点
【CKA模拟题】查找集群中使用内存最高的node节点
16 1
|
7月前
|
前端开发
bat 批处理文件 结束node进程 杀死指定端口
bat 批处理文件 结束node进程 杀死指定端口
|
26天前
|
数据库 存储 监控
什么是 SAP HANA 内存数据库 的 Delta Storage
什么是 SAP HANA 内存数据库 的 Delta Storage
17 0
什么是 SAP HANA 内存数据库 的 Delta Storage
|
6月前
|
Kubernetes 容器
k8s集群—node节点的删除与添加
k8s集群—node节点的删除与添加
282 0
|
6月前
|
Kubernetes 网络协议 API
node节点加入k8s集群时报错:no such host
node节点加入k8s集群时报错:no such host
137 0
|
4月前
|
关系型数据库 数据库 OceanBase
重启集群中所有节点的 observer 进程
重启集群中所有节点的 observer 进程
30 0
|
5月前
|
流计算
110 Storm集群的进程及日志熟悉
110 Storm集群的进程及日志熟悉
35 0
|
10月前
|
负载均衡 监控 JavaScript
一文教你如何使用Node进程管理工具-pm2
一文教你如何使用Node进程管理工具-pm2
206 0
|
消息中间件 JavaScript Shell
Node 进程
在操作系统中,对进程的解释:进程是一个具有一定独立功能的程序在一个数据集上的一次动态执行的过程,是操作系统进行资源分配和调度的一个独立单位,是应用程序运行的载体。 - 是应用程序的一次运行过程(动态概念) - 是系统分配和调度资源的基本单位(进程是一般由程序、数据集合和进程控制块三部分组成) - 每个进程有自己独立的空间地址,数据栈(各进程间数据不共享,可通过其他方式进行通信)进程一般有初始态,执行态,等待状态,就绪状态,终止状态五种状态
81 0
|
Kubernetes 容器
k8s集群添加删除node节点
k8s集群添加删除node节点
162 0