用nodejs的朋友都有了解,node是單線程的,也就是說跑在8核CPU上,只能使用一個核的算力。
單執行緒一直是node的一個詬病,但隨著0.6版本中引入cluster之後,這個情況則得到了改變,開發人員可以依靠cluster很輕鬆的將自己的Node伺服器擴展為多執行緒伺服器了。
什麼是Cluster
cluster是node提供的一個多線程庫,用戶可以使用它來創建多個線程,線程之間共享一個監聽端口,當有外部請求這個端口時,cluster會將請求轉發到隨機線程裡。因為每個node線程都會佔用幾十兆的內存,所以不能像php那樣對每個請求創建一個線程,一般來說創建的線程數最多都不會超過cpu的核心數。
if (cluster.isMaster) {
// Fork workers.
for (var i = 0; i
cluster.fork();
}
cluster.on('exit', function(worker, code, signal) {
console.log('worker ' worker.process.pid ' died');
});
} else {
// Workers can share any TCP connection
// In this case its a HTTP server
http.createServer(function(req, res) {
res.writeHead(200);
res.end("hello worldn");
}).listen(8000);
}
如以上程式碼所示,程式執行時期cluster.isMaster會被設定為true,當呼叫cluster.fork()之後,程式會建立一個線程,並重新運行,這時cluster.isMaster就被設定為false了。我們主要透過這個變數來判斷當前線程是不是子線程的。
也可以注意到,每個子執行緒被建立之後,都會監聽8000埠而不會引起衝突,這就是cluster共享埠的功能了。
執行緒之間的通訊
當執行緒被創建之後,他們彼此之間是沒有共享記憶體或資料的。所有的資料交換只能透過worker.send和worker.on('message',handler)在主執行緒處理,下面列舉一個廣播系統的實例。
if (cluster.isMaster) {
var workers=[];
//新建worker
function newWorker(){
var worker=cluster.fork();
//監聽訊息,若type為broadcast的話,則認定為廣播
worker.on('message', function(msg) {
if(msg.type=='broadcast'){
var event=msg.event;
//傳送此條廣播給所有worker
workers.forEach(function(worker){
worker.send(event);
})
}
});
return worker;
}
for (var i = 0; i
workers.push(newWorker());
}
cluster.on('online',function(worker){
console.log('worker %d is online',worker.id);
})
} else {
var worker=cluster.worker;
//廣播就是傳送一個type為broadcast的訊息,event就是廣播內容
worker.broadcast=function(event){
worker.send({
type:'broadcast',
event:event
});
}
//這裡用worker.on似乎不能監聽到回傳的訊息
process.on('message',function(event){
console.log('worker: ' worker.id ' recived event from ' event.workerId);
})
//發送廣播
worker.broadcast({
message:'online',
workerId:worker.id
})
}
需要注意的問題
在上面也提到,執行緒之間是不能共享資料的,所有的資料交換只能透過執行緒之間的通訊來交換。而且交換的資料都是可序列化的,所以函數,檔案描述子和HttpResponse之類的東西都不能傳遞。
如果使用cluster,則需要在程式設計的時候考慮到資料交換的問題,我自己的做法就是將類似session的這些資料都存放在redis裡,每個執行緒都做好存取的工作,所有的資料都不放在node記憶體裡。
最後一點,cluster目前還被Node官方標記為Experimental狀態,api在未來或許會改變。