Node.js의 다중 프로세스와 다중 스레딩에 대해 이야기해 보겠습니다.

青灯夜游
풀어 주다: 2022-07-25 19:45:58
앞으로
2378명이 탐색했습니다.

모든 사람은 Node가 단일 스레드라는 것을 알고 있지만 일부 특수 작업의 처리 속도를 높이기 위해 다중 스레드(스레드) 모듈도 제공한다는 사실은 모릅니다. Node.js의 스레드(thread)가 모두에게 도움이 되었으면 좋겠습니다!

Node.js의 다중 프로세스와 다중 스레딩에 대해 이야기해 보겠습니다.

우리 모두는 Node.js가 단일 스레드, 이벤트 중심 비동기 I/O 모델을 사용한다는 것을 알고 있습니다. 그 특성으로 인해 멀티 코어 CPU를 활용할 수 없으며 일부를 완료하는 데 좋지 않습니다. 이러한 문제를 해결하기 위해 Node.js는 I/O가 아닌 유형의 작업(예: 스크립트 실행, AI 계산, 이미지 처리 등)을 제공합니다. 스레드에 대해서는 저자 기사 Node.js 및 동시성 모델의 다른 기사를 참조하세요. 이 기사에서는 Node.js의 다중 스레드 메커니즘을 소개합니다.

child_process

child_process 모듈을 사용하면 Node.js의 하위 프로세스를 생성하여 일부 특수 작업(예: 스크립트 실행)을 완료할 수 있습니다. , execFile, fork, spwan 및 기타 메소드 아래에서는 이러한 메소드의 사용법을 간략하게 소개합니다. child_process 模块创建 Node.js 的子进程,来完成一些特殊的任务(比如执行脚本),该模块主要提供了 execexecFileforkspwan 等方法,下面我们就简单介绍下这些方法的使用。

exec

const { exec } = require('child_process');

exec('ls -al', (error, stdout, stderr) => {
  console.log(stdout);
});
로그인 후 복사

该方法根据 options.shell 指定的可执行文件处理命令字符串,在命令的执行过程中缓存其输出,直到命令执行完成后,再将执行结果以回调函数参数的形式返回。

该方法的参数解释如下:

execFile

const { execFile } = require('child_process');

execFile('ls', ['-al'], (error, stdout, stderr) => {
  console.log(stdout);
});
로그인 후 복사
로그인 후 복사

该方法的功能类似于 exec,唯一的区别是 execFile 在默认情况下直接用指定的可执行文件(即参数 file 的值)处理命令,这使得其效率略高于 exec(如果查看 shell 的处理逻辑,笔者感觉这效率可忽略不计)。

该方法的参数解释如下:

  • file:可执行文件的名字或路径;

  • args:可执行文件的参数列表;

  • options:参数设置(可不指定),相关属性如下:

    • shell:值为 false 时表示直接用指定的可执行文件(即参数 file 的值)处理命令,值为 true 或其它字符串时,作用等同于 exec 中的 shell,默认值为 false
    • windowsVerbatimArguments:在 Windows 中是否对参数进行引号或转义处理,在 Unix 中将忽略该属性,默认值为 false
    • 属性 cwdenvencodingtimeoutmaxBufferkillSignaluidgidwindowsHidesignal 在上文中已介绍,此处不再重述。
  • callback:回调函数,等同于 exec 中的 callback,此处不再阐述。

fork

const { fork } = require('child_process');

const echo = fork('./echo.js', {
  silent: true
});
echo.stdout.on('data', (data) => {
  console.log(`stdout: ${data}`);
});

echo.stderr.on('data', (data) => {
  console.error(`stderr: ${data}`);
});

echo.on('close', (code) => {
  console.log(`child process exited with code ${code}`);
});
로그인 후 복사
로그인 후 복사

该方法用于创建新的 Node.js 实例以执行指定的 Node.js 脚本,与父进程之间以 IPC 方式进行通信。

该方法的参数解释如下:

  • modulePath:要运行的 Node.js 脚本路径;

  • args:传递给 Node.js 脚本的参数列表;

  • options:参数设置(可不指定),相关属性如:

    • detached:参见下文对 spwanoptions.detached 的说明;

    • execPath:创建子进程的可执行文件;

    • execArgv:传递给可执行文件的字符串参数列表,默认取 process.execArgv 的值;

    • serialization:进程间消息的序列号类型,可用值为 jsonadvanced,默认值为 json

    • slient: 如果为 true,子进程的 stdinstdoutstderr 将通过管道传递给父进程,否则将继承父进程的 stdinstdoutstderr;默认值为 false

    • stdio:参见下文对 spwanoptions.stdio 的说明。这里需要注意的是:

      • 如果指定了该属性,将忽略 slient 的值;
      • 必须包含一个值为 ipc 的选项(比如 [0, 1, 2, 'ipc']),否则将抛出异常。
    • 属性 cwdenvuidgidwindowsVerbatimArgumentssignaltimeoutkillSignal 在上文中已介绍,此处不再重述。

spwan

const { spawn } = require('child_process');

const ls = spawn('ls', ['-al']);
ls.stdout.on('data', (data) => {
  console.log(`stdout: ${data}`);
});

ls.stderr.on('data', (data) => {
  console.error(`stderr: ${data}`);
});

ls.on('close', (code) => {
  console.log(`child process exited with code ${code}`);
});
로그인 후 복사
로그인 후 복사

该方法为 child_process 模块的基础方法,execexecFilefork 最终都会调用 spawn 来创建子进程。

该方法的参数解释如下:

  • command:可执行文件的名字或路径;

  • args:传递给可执行文件的参数列表;

  • options:参数设置(可不指定),相关属性如下:

    • argv0:发送给子进程 argv[0] 的值,默认取参数 command 的值;

    • detached:是否允许子进程可以独立于父进程运行(即父进程退出后,子进程可以继续运行),默认值为 false,其值为 true 时,各平台的效果如下所述:

      • Windows 系统中,父进程退出后,子进程可以继续运行,并且子进程拥有自己的控制台窗口(该特性一旦启动后,在运行过程中将无法更改);
      • 在非 Windows 系统中,子进程将作为新进程会话组的组长,此刻不管子进程是否与父进程分离,子进程都可以在父进程退出后继续运行。

      需要注意的是,如果子进程需要执行长时间的任务,并且想要父进程提前退出,需要同时满足以下几点:

      • 调用子进程的 unref 方法从而将子进程从父进程的事件循环中剔除;
      • detached 设置为 true
      • stdioignore

      比如下面的例子:

      // hello.js
      const fs = require('fs');
      let index = 0;
      function run() {
        setTimeout(() => {
          fs.writeFileSync('./hello', `index: ${index}`);
          if (index < 10) {
            index += 1;
            run();
          }
        }, 1000);
      }
      run();
      
      // main.js
      const { spawn } = require(&#39;child_process&#39;);
      const child = spawn(&#39;node&#39;, [&#39;./hello.js&#39;], {
        detached: true,
        stdio: &#39;ignore&#39;
      });
      child.unref();
      로그인 후 복사
    • stdio:子进程标准输入输出配置,默认值为 pipe,值为字符串或数组:

      • 值为字符串时,会将其转换为含有三个项的数组(比如 pipe 被转换为 [&#39;pipe&#39;, &#39;pipe&#39;, &#39;pipe&#39;]),可用值为 pipeoverlappedignoreinherit
      • 值为数组时,其中数组的前三项分别代表对 stdinstdoutstderr 的配置,每一项的可用值为 pipeoverlappedignoreinheritipcStream 对象、正整数(在父进程打开的文件描述符)、null(如位于数组的前三项,等同于 pipe,否则等同于 ignore)、undefined(如位于数组的前三项,等同于 pipe,否则等同于 ignore)。
    • 属性 cwdenvuidgidserializationshell(值为 booleanstring)、windowsVerbatimArgumentswindowsHidesignaltimeoutkillSignal 在上文中已介绍,此处不再重述。

小结

上文对 child_process 模块中主要方法的使用进行了简短介绍,由于 execSyncexecFileSyncforkSyncspwanSync 方法是 execexecFilespwan 的同步版本,其参数并无任何差异,故不再重述。

cluster

通过 cluster 模块我们可以创建 Node.js 进程集群,通过 Node.js 进程进群,我们可以更加充分地利用多核的优势,将程序任务分发到不同的进程中以提高程序的执行效率;下面将通过例子为大家介绍 cluster 模块的使用:

const http = require(&#39;http&#39;);
const cluster = require(&#39;cluster&#39;);
const numCPUs = require(&#39;os&#39;).cpus().length;

if (cluster.isPrimary) {
  for (let i = 0; i < numCPUs; i++) {
    cluster.fork();
  }
} else {
  http.createServer((req, res) => {
    res.writeHead(200);
    res.end(`${process.pid}\n`);
  }).listen(8000);
}
로그인 후 복사

上例通过 cluster.isPrimary 属性判断(即判断当前进程是否为主进程)将其分为两个部分:

  • 为真时,根据 CPU 内核的数量并通过 cluster.fork 调用来创建相应数量的子进程;
  • 为假时,创建一个 HTTP server,并且每个 HTTP server 都监听同一个端口(此处为 8000)。

运行上面的例子,并在浏览器中访问 http://localhost:8000/,我们会发现每次访问返回的 pid 都不一样,这说明了请求确实被分发到了各个子进程。Node.js 默认采用的负载均衡策略是轮询调度,可通过环境变量 NODE_CLUSTER_SCHED_POLICYcluster.schedulingPolicy 属性来修改其负载均衡策略:

NODE_CLUSTER_SCHED_POLICY = rr // 或 none

cluster.schedulingPolicy = cluster.SCHED_RR; // 或 cluster.SCHED_NONE
로그인 후 복사

另外需要注意的是,虽然每个子进程都创建了 HTTP server,并都监听了同一个端口,但并不代表由这些子进程自由竞争用户请求,因为这样无法保证所有子进程的负载达到均衡。所以正确的流程应该是由主进程监听端口,然后将用户请求根据分发策略转发到具体的子进程进行处理。

由于进程之间是相互隔离的,因此进程之间一般通过共享内存消息传递管道等机制进行通讯。Node.js 则是通过消息传递来完成父子进程之间的通信,比如下面的例子:

const http = require(&#39;http&#39;);
const cluster = require(&#39;cluster&#39;);
const numCPUs = require(&#39;os&#39;).cpus().length;

if (cluster.isPrimary) {
  for (let i = 0; i < numCPUs; i++) {
    const worker = cluster.fork();
    worker.on(&#39;message&#39;, (message) => {
      console.log(`I am primary(${process.pid}), I got message from worker: "${message}"`);
      worker.send(`Send message to worker`)
    });
  }
} else {
  process.on(&#39;message&#39;, (message) => {
    console.log(`I am worker(${process.pid}), I got message from primary: "${message}"`)
  });
  http.createServer((req, res) => {
    res.writeHead(200);
    res.end(`${process.pid}\n`);
    process.send(&#39;Send message to primary&#39;);
  }).listen(8000);
}
로그인 후 복사

运行上面的例子,并访问 http://localhost:8000/,再查看终端,我们会看到类似下面的输出:

I am primary(44460), I got message from worker: "Send message to primary"
I am worker(44461), I got message from primary: "Send message to worker"
I am primary(44460), I got message from worker: "Send message to primary"
I am worker(44462), I got message from primary: "Send message to worker"
로그인 후 복사

利用该机制,我们可以监听各子进程的状态,以便在某个子进程出现意外后,能够及时对其进行干预,以保证服务的可用性。

cluster 模块的接口非常简单,为了节省篇幅,这里只对 cluster.setupPrimary 方法做一些特别声明,其它方法请查看官方文档

  • cluster.setupPrimary 调用后,相关设置将同步到在 cluster.settings 属性中,并且每次调用都基于当前 cluster.settings 属性的值;
  • cluster.setupPrimary 调用后,对已运行的子进程没有影响,只影响后续的 cluster.fork 调用;
  • cluster.setupPrimary 调用后,不影响后续传递给 cluster.fork 调用的 env 参数;
  • cluster.setupPrimary 只能在主进程中使用。

worker_threads

前文我们对 cluster 模块进行了介绍,通过它我们可以创建 Node.js 进程集群以提高程序的运行效率,但 cluster 基于多进程模型,进程间高成本的切换以及进程间资源的隔离,会随着子进程数量的增加,很容易导致因系统资源紧张而无法响应的问题。为解决此类问题,Node.js 提供了 worker_threads,下面我们通过具体的例子对该模块的使用进行简单介绍:

// server.js
const http = require(&#39;http&#39;);
const { Worker } = require(&#39;worker_threads&#39;);

http.createServer((req, res) => {
  const httpWorker = new Worker(&#39;./http_worker.js&#39;);
  httpWorker.on(&#39;message&#39;, (result) => {
    res.writeHead(200);
    res.end(`${result}\n`);
  });
  httpWorker.postMessage(&#39;Tom&#39;);
}).listen(8000);

// http_worker.js
const { parentPort } = require(&#39;worker_threads&#39;);

parentPort.on(&#39;message&#39;, (name) => {
  parentPort.postMessage(`Welcone ${name}!`);
});
로그인 후 복사

上例展示了 worker_threads 的简单使用,在使用 worker_threads 的过程中,需要注意以下几点:

  • 通过 worker_threads.Worker 创建 Worker 实例,其中 Worker 脚本既可以为一个独立的 JavaScript 文件,也可以为字符串,比如上例可修改为:

    const code = "const { parentPort } = require(&#39;worker_threads&#39;); parentPort.on(&#39;message&#39;, (name) => {parentPort.postMessage(`Welcone ${name}!`);})";
    const httpWorker = new Worker(code, { eval: true });
    로그인 후 복사
  • 通过 worker_threads.Worker 创建 Worker 实例时,可以通过指定 workerData 的值来设置 Worker 子线程的初始元数据,比如:

    // server.js
    const { Worker } = require(&#39;worker_threads&#39;);
    const httpWorker = new Worker(&#39;./http_worker.js&#39;, { workerData: { name: &#39;Tom&#39;} });
    
    // http_worker.js
    const { workerData } = require(&#39;worker_threads&#39;);
    console.log(workerData);
    로그인 후 복사
  • 通过 worker_threads.Worker 创建 Worker 实例时,可通过设置 SHARE_ENV 以实现在 Worker 子线程与主线程之间共享环境变量的需求,比如:

    const { Worker, SHARE_ENV } = require(&#39;worker_threads&#39;);
    const worker = new Worker(&#39;process.env.SET_IN_WORKER = "foo"&#39;, { eval: true, env: SHARE_ENV });
    worker.on(&#39;exit&#39;, () => {
      console.log(process.env.SET_IN_WORKER);
    });
    로그인 후 복사
  • 不同于 cluster 中进程间的通信机制,worker_threads 采用的 MessageChannel 来进行线程间的通信:

    • Worker 子线程通过 parentPort.postMessage 方法发送消息给主线程,并通过监听 parentPortmessage 事件来处理来自主线程的消息;
    • 主线程通过 Worker 子线程实例(此处为 httpWorker,以下均以此代替 Worker 子线程)的 postMessage 方法发送消息给 httpWorker,并通过监听 httpWorkermessage 事件来处理来自 Worker 子线程的消息。
  • 在 Node.js 中,无论是 cluster 创建的子进程,还是 worker_threads 创建的 Worker 子线程,它们都拥有属于自己的 V8 实例以及事件循环,所不同的是:

    • 子进程之间的内存空间是互相隔离的,而 Worker 子线程共享所属进程的内存空间;
    • 子进程之间的切换成本要远远高于 Worker 子线程之间的切换成本。

    尽管看起来 Worker 子线程比子进程更高效,但 Worker 子线程也有不足的地方,即cluster 提供了负载均衡,而 worker_threads 则需要我们自行完成负载均衡的设计与实现。

    요약

    이 글에서는 Node.js에서 child_processclusterworker_threads 세 가지 모듈을 사용하는 방법을 소개합니다. 이 세 가지 모듈을 통해 CPU 멀티 코어의 장점을 최대한 활용하고 멀티 스레드(스레드) 모드를 사용하여 효율적으로 문제를 해결할 수 있습니다. 일부 문제 특수 작업(예: AI, 이미지 처리 등)의 운영 효율성. 각 모듈에는 적용 가능한 시나리오가 있습니다. 이 문서에서는 기본 사용법만 설명합니다. 자신의 문제에 따라 효율적으로 사용하는 방법은 아직 직접 탐색해야 합니다. 마지막으로, 이 글에 잘못된 부분이 있다면 바로잡아주시길 바랍니다. 모두들 행복한 코딩생활 되시기 바랍니다.

    노드 관련 지식을 더 보려면 nodejs 튜토리얼을 방문하세요!

    위 내용은 Node.js의 다중 프로세스와 다중 스레딩에 대해 이야기해 보겠습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨:
원천:juejin.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
최신 이슈
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿
회사 소개 부인 성명 Sitemap
PHP 중국어 웹사이트:공공복지 온라인 PHP 교육,PHP 학습자의 빠른 성장을 도와주세요!