深入淺析Node.js單執行緒模型

深入淺析Node.js單執行緒模型

Node.js採用 事件驅動 和 非同步I/O 的方式,實現了一個單執行緒、高併發的執行時環境,而單執行緒就意味著同一時間只能做一件事,那麼Node.js如何利用單執行緒來實現高併發和非同步I/O?本文將圍繞這個問題來探討Node.js的單執行緒模型:

1、高併發

一般來說,高併發的解決方案就是多執行緒模型,伺服器為每個客戶端請求分配一個執行緒,使用同步I/O,系統通過執行緒切換來彌補同步I/O呼叫的時間開銷,比如Apache就是這種策略,由於I/O一般都是耗時操作,因此這種策略很難實現高效能,但非常簡單,可以實現複雜的互動邏輯。

而事實上,大多數網站的伺服器端都不會做太多的計算,它們只是接收請求,交給其它服務(比如從資料庫讀取資料),然後等著結果返回再發給客戶端。因此,Node.js針對這一事實採用了單執行緒模型來處理,它不會為每個接入請求分配一個執行緒,而是用一個主執行緒處理所有的請求,然後對I/O操作進行非同步處理,避開了建立、銷燬執行緒以及線上程間切換所需的開銷和複雜性。

2、事件迴圈

Node.js 在主執行緒中維護了一個事件佇列,當接收到請求後,就將請求作為一個事件放入該佇列中,然後繼續接收其他請求。當主執行緒空閒時(沒有請求接入時),就開始迴圈事件佇列,檢查佇列中是否有要處理的事件,這時要分兩種情況:如果是非I/O任務,就親自處理,並通過回撥函式返回到上層呼叫;如果是I/O任務,就從執行緒池中拿出一個執行緒來執行這個事件,並指定回撥函式,然後繼續迴圈佇列中的其他事件。當執行緒中的I/O任務完成後,就執行指定的回撥函式,並把這個完成的事件放到事件佇列的尾部,等待事件迴圈,當主執行緒再次迴圈到該事件時,就直接處理並返回給上層呼叫。 這個過程就叫事件迴圈(Event Loop),如下圖所示:

這個圖是整個Node.js的執行原理,從左到右,從上到下,Node.js被分成了四層,分別是應用層、V8引擎層、Node API層 和 LIBUV層,

應用層:   即Javascript互動層,常見的就是Node.js的模組,比如 http,fs
V8引擎層:  即利用V8引擎來解析Javascript語法,進而和下層API互動
NodeAPI層:  為上層模組提供系統呼叫,一般是由C語言來實現,和作業系統進行互動
LIBUV層: 即Event Loop,是Node.js實現非同步的核心,由LIBUV庫來實現,而LIBUV中的執行緒池是由作業系統核心接受管理的。

從上述理解來看,Node.js的單執行緒僅僅是指Javascript執行在單執行緒中,而並非Node.js是單執行緒,在Node中,無論是Linux平臺還是Windows平臺,內部都是通過執行緒池來完成IO操作,而LIBUV就是針對不同平臺的差異性實現了統一呼叫。

3、事件驅動

總結上面的過程可以發現,Node.js的核心是使用事件驅動模式實現了非同步I/O,為了更具體、更清晰的理解和接受這個事實,我們用程式碼來描述Node.js的事件驅動模型:

3.1、事件佇列

首先,我們需要定義一個事件佇列,既然是佇列,那就是一個先進先出(FIFO)的資料結構,我們用JS的陣列來描述,如下:


/**
* 定義事件佇列
* 入隊:unshfit()
* 出隊:pop()
* 空佇列:length == 0
*/
eventQueue:[],

為了方便理解,我們規定:陣列的第一個元素是佇列的尾部,陣列的最後一個元素是佇列的頭部, unshfit 就是在尾部插入一個元素,pop就是從頭部彈出一個元素,這樣就實現了一個簡單的佇列。

3.2、接收請求

定義一個總的入口來接收使用者請求,如下所示:


/**
* 接收使用者請求
* 每一個請求都會進入到該函式
* 傳遞引數request和response
*/
processHttpRequest:function(request,response){
//定義一個事件物件
var event = createEvent({
params:request.params, //傳遞請求引數
result:null, //存放請求結果
callback:function(){} //指定回撥函式
});
//在佇列的尾部新增該事件 
eventQueue.unshift(event);
},

這個函式很簡單,就是把使用者的請求包裝成事件,放到佇列裡,然後繼續接收其他請求。

3.3、事件迴圈

當主執行緒處於空閒時就開始迴圈事件佇列,所以,我們再定義一個事件迴圈的函式:


/**
* 事件迴圈主體,主執行緒擇機執行
* 迴圈遍歷事件佇列
* 處理事件
* 執行回撥,返回給上層
*/
eventLoop:function(){
//如果佇列不為空,就繼續迴圈
while(this.eventQueue.length > 0){
//從佇列的頭部拿出一個事件
var event = this.eventQueue.pop();
//如果是IO任務
if(isIOTask(event)){
//從執行緒池裡拿出一個執行緒
var thread = getThreadFromThreadPool();
//交給執行緒處理
thread.handleIOTask(event)
}else {
//非IO任務處理後,直接返回結果
var result = handleEvent(event);
//最終通過回撥函式返回給V8,再由V8返回給應用程式
event.callback.call(null,result);
}
}
},

主執行緒不停的檢測事件佇列,對於IO任務就交給執行緒池來處理,非IO任務就自己處理並返回。

3.4、執行緒池

執行緒池接到任務以後,直接處理IO操作,比如讀取資料庫:

當IO


/**
* 處理IO任務
* 完成後將事件新增到佇列尾部
* 釋放執行緒
*/
handleIOTask:function(event){
//當前執行緒
var curThread = this;
//運算元據庫
var optDatabase = function(params,callback){
var result = readDataFromDb(params);
callback.call(null,result)
};
//執行IO任務
optDatabase(event.params,function(result){
//返回結果存入事件物件中
event.result = result;
//IO完成後,將不再是耗時任務
event.isIOTask = false;
//將該事件重新新增到佇列的尾部
this.eventQueue.unshift(event);
//釋放當前執行緒
releaseThread(curThread)
})
}

任務完成以後就執行回撥,把請求結果存入事件中,並將該事件重新放入佇列中,等待迴圈,最後釋放執行緒。當主執行緒再次迴圈到該事件時,就直接處理了。

 4、Node.js軟肋

以上四步簡單描述了Node.js事件驅動模型,至此,我們對Node.js應該有了一個簡單而又清晰的認識,但Node.js 並不是什麼都能做。

上面提到,如果是I/O任務,Nodejs就把任務交給執行緒池來非同步處理,高效簡單,因此Node.js適合處理I/O密集型任務,但不是所有的任務都是I/O密集型任務,當碰到CPU密集型任務時,就是隻用CPU計算的操作,比如要對資料加解密(node.bcrypt.js),資料壓縮和解壓(node-tar),這時Node.js就會親自處理,一個一個的計算,前面的任務沒有執行完,後面的任務只能乾等著,如下圖所示:

在事件佇列中,如果前面的CPU計算任務沒有完成,那麼後面的任務就會被阻塞,出現響應緩慢的情況,如果作業系統本身就是單核,那也就算了,但現在大部分伺服器都是多CPU或多核的,而Node.js只有一個EventLoop,也只佔用一個CPU/核心,當Node.js被CPU密集型任務佔用,導致其他任務被阻塞時,卻還有CPU/核心處理閒置狀態,造成資源浪費。因此Node.js不適合CPU密集型任務。

 

5、Node.js適用場景

5.1、RESTful API

這是適合 Node 的理想情況,因為您可以構建它來處理數萬條連線。它仍然不需要大量邏輯;它本質上只是從某個資料庫中查詢一些值並將它們組成一個響應。由於響應是少量文字,入站請求也是少量的文字,因此流量不高,一臺機器甚至也可以處理最繁忙的公司的 API 需求。

5.2、實時程式

比如聊天服務,聊天應用程式是最能體現 Node.js 優點的例子:輕量級、高流量並且能良好的應對跨平臺裝置上執行密集型資料(雖然計算能力低)。同時,聊天也是一個非常值得學習的用例,因為它很簡單,並且涵蓋了目前為止一個典型的 Node.js 會用到的大部分解決方案。

以上所述是小編給大家介紹的Node.js單執行緒模型,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回覆大家的。在此也非常感謝大家對指令碼之家網站的支援!

您可能感興趣的文章:

Node.js事件迴圈(Event Loop)和執行緒池詳解