Wenn Sie PM2 zum Verwalten von Node.js-Prozessen verwendet haben, ist Ihnen möglicherweise aufgefallen, dass es einen Cluster-Modus unterstützt. In diesem Modus kann Node.js mehrere Prozesse erstellen. Wenn Sie die Anzahl der Instanzen im Cluster-Modus auf max festlegen, erstellt PM2 automatisch eine Anzahl von Knotenprozessen, die den auf dem Server verfügbaren CPU-Kernen entsprechen.
PM2 erreicht dies durch die Nutzung des Cluster-Moduls von Node.js. Das Modul befasst sich mit der Single-Threaded-Natur von Node.js, die traditionell die Fähigkeit zur Nutzung mehrerer CPU-Kerne einschränkt. Doch wie funktioniert das Cluster-Modul intern? Wie kommunizieren die Prozesse miteinander? Wie können mehrere Prozesse denselben Port abhören? Und wie verteilt Node.js Anfragen an diese Prozesse? Wenn Sie neugierig auf diese Fragen sind, lesen Sie weiter.
Node.js-Arbeitsprozesse werden mit der Methode child_process.fork() erstellt. Das bedeutet, dass es einen übergeordneten Prozess und mehrere untergeordnete Prozesse gibt. Der Code sieht normalerweise so aus:
const cluster = require('cluster'); const os = require('os'); if (cluster.isMaster) { for (let i = 0, n = os.cpus().length; i < n; i++) { cluster.fork(); } } else { // Start the application }
Wenn Sie sich mit Betriebssystemen befasst haben, sind Sie wahrscheinlich mit dem Systemaufruf fork() vertraut. Der aufrufende Prozess ist der übergeordnete Prozess, während die neu erstellten Prozesse die untergeordneten Prozesse sind. Diese untergeordneten Prozesse teilen sich dasselbe Datensegment und denselben Stapel wie die übergeordneten Prozesse, ihre physischen Speicherbereiche werden jedoch nicht unbedingt gemeinsam genutzt. In einem Node.js-Cluster überwacht der Master-Prozess den Port und verteilt eingehende Anfragen an die Worker-Prozesse. Dabei geht es um die Behandlung von drei Kernthemen: Interprozesskommunikation (IPC), Lastausgleichsstrategien und Multiprozess-Port-Listening.
Der Master-Prozess erstellt untergeordnete Prozesse mithilfe von process.fork(). Die Kommunikation zwischen diesen Prozessen erfolgt über einen IPC-Kanal. Betriebssysteme bieten mehrere Mechanismen für die Kommunikation zwischen Prozessen, wie zum Beispiel:
Message Passing
Prozesse tauschen Daten durch Senden und Empfangen von Nachrichten aus.
Semaphoren
Ein Semaphor ist ein vom System zugewiesener Statuswert. Prozesse ohne Kontrolle werden gezwungen, an bestimmten Kontrollpunkten anzuhalten und auf ein Signal zum Fortfahren zu warten. Wenn dieser Mechanismus auf Binärwerte (0 oder 1) beschränkt ist, wird er als „Mutex“ (gegenseitige Ausschlusssperre) bezeichnet.
Rohre
Pipes verbinden zwei Prozesse, sodass die Ausgabe eines Prozesses als Eingabe für einen anderen Prozess dienen kann. Dies kann mit dem Pipe-Systemaufruf erstellt werden. Die | Der Befehl im Shell-Scripting ist ein häufiges Beispiel für diesen Mechanismus.
Node.js verwendet einen ereignisbasierten Mechanismus für die Kommunikation zwischen den übergeordneten und untergeordneten Prozessen. Hier ist ein Beispiel für einen übergeordneten Prozess, der ein TCP-Server-Handle an einen untergeordneten Prozess sendet:
const cluster = require('cluster'); const os = require('os'); if (cluster.isMaster) { for (let i = 0, n = os.cpus().length; i < n; i++) { cluster.fork(); } } else { // Start the application }
Wie bereits erwähnt, werden alle Anfragen durch den Master-Prozess verteilt. Um sicherzustellen, dass die Serverlast gleichmäßig auf die Arbeitsprozesse verteilt wird, ist eine Lastausgleichsstrategie erforderlich. Node.js verwendet standardmäßig einen Round-Robin-Algorithmus.
Die Round-Robin-Methode ist ein gängiger Lastausgleichsalgorithmus, der auch von Nginx verwendet wird. Es funktioniert, indem eingehende Anfragen nacheinander an jeden Prozess verteilt werden, beginnend beim ersten Prozess und in einer Schleife zurück, nachdem der letzte erreicht wurde. Allerdings geht diese Methode von der gleichen Verarbeitungskapazität aller Prozesse aus. In Szenarien, in denen die Bearbeitungszeit von Anfragen erheblich schwankt, kann es zu einem Lastungleichgewicht kommen.
Um dieses Problem zu beheben, verwendet Nginx häufig Weighted Round-Robin (WRR), bei dem Servern unterschiedliche Gewichtungen zugewiesen werden. Der Server mit der höchsten Gewichtung wird ausgewählt, bis seine Gewichtung auf Null reduziert wird. An diesem Punkt beginnt der Zyklus basierend auf der neuen Gewichtsfolge von vorne.
Sie können die Lastausgleichsstrategie in Node.js anpassen, indem Sie die Umgebungsvariable NODE_CLUSTER_SCHED_POLICY festlegen oder sie über Cluster.setupMaster (Optionen) konfigurieren. Die Kombination von Nginx für Multi-Maschinen-Cluster mit Node.js-Cluster für den Multiprozessausgleich auf einer Maschine ist ein gängiger Ansatz.
In frühen Versionen von Node.js konkurrierten mehrere Prozesse, die denselben Port überwachten, um eingehende Verbindungen, was zu einer ungleichmäßigen Lastverteilung führte. Dies wurde später mit der Round-Robin-Strategie gelöst. Der aktuelle Ansatz funktioniert wie folgt:
Im Wesentlichen überwacht der Master-Prozess den Port und verteilt Verbindungen an Arbeitsprozesse mithilfe einer definierten Strategie (z. B. Round-Robin). Dieses Design eliminiert den Wettbewerb zwischen Arbeitern, erfordert jedoch eine hohe Stabilität des Masterprozesses.
In diesem Artikel wurden anhand des Cluster-Modus von PM2 als Einstiegspunkt die Kernprinzipien des Cluster-Moduls von Node.js zur Implementierung von Multiprozessanwendungen untersucht. Wir haben uns auf drei Schlüsselaspekte konzentriert: Kommunikation zwischen Prozessen, Lastausgleich und Multiprozess-Port-Listening.
Durch das Studium des Cluster-Moduls können wir erkennen, dass viele Grundprinzipien und Algorithmen universell sind. Beispielsweise wird der Round-Robin-Algorithmus sowohl bei der Prozessplanung des Betriebssystems als auch beim Lastausgleich des Servers verwendet. Die Master-Worker-Architektur ähnelt dem Multiprozessdesign in Nginx. Ebenso sind Mechanismen wie Semaphoren und Pipes in verschiedenen Programmierparadigmen allgegenwärtig.
Während ständig neue Technologien entstehen, bleiben ihre Grundlagen konsistent. Das Verständnis dieser Kernkonzepte ermöglicht es uns, neue Herausforderungen mit Zuversicht zu extrapolieren und uns an sie anzupassen.
Leapcell ist die serverlose Plattform der nächsten Generation für Webhosting, Async-Aufgaben und Redis:
Mehrsprachige Unterstützung
Stellen Sie unbegrenzt viele Projekte kostenlos bereit
Unschlagbare Kosteneffizienz
Optimierte Entwicklererfahrung
Mühelose Skalierbarkeit und hohe Leistung
Erfahren Sie mehr in der Dokumentation!
Folgen Sie uns auf X: @LeapcellHQ
Lesen Sie auf unserem Blog
Das obige ist der detaillierte Inhalt vonNode.js-Cluster verstehen: Die Kernkonzepte. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!