首頁 > web前端 > js教程 > NodeJS中Buffer模組詳解_node.js

NodeJS中Buffer模組詳解_node.js

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB
發布: 2016-05-16 16:21:34
原創
1651 人瀏覽過

一,開頭分析

所謂緩衝區Buffer,就是 "臨時存貯區" 的意思,是暫時存放輸入輸出資料的一段記憶體。

JS語言本身只有字串資料類型,沒有二進位資料類型,因此NodeJS提供了一個與String對等的全域建構子Buffer來提供對二進位資料的運算。除了可以讀取檔案得到Buffer的實例外,還能夠直接構造,例如:

複製程式碼 程式碼如下:

 var buffer = new Buffer([ 0x68, 0x65, 0x6c, 0x6c, 0x6f ]) ;

Buffer與字串類似,除了可以用.length屬性得到位元組長度外,還可以用[index]方式讀取指定位置的位元組,例如:

複製程式碼 程式碼如下:

buffer[0] ; // 0x68;

Buffer與字串能夠互相轉化,例如可以使用指定編碼將二進位資料轉化為字串:

複製程式碼 程式碼如下:

var str = buffer.toString("utf-8");  // hello

將字串轉換為指定編碼下的二進位資料:

複製程式碼 程式碼如下:

var buffer= new Buffer("hello", "utf-8") ; //

一點兒區別:

Buffer與字串有一個重要差異。字串是唯讀的,並且對字串的任何修改得到的都是一個新字串,原始字串保持不變。

至於Buffer,更像是可以做指標操作的C語言陣列。例如,可以用[index]方式直接修改某個位置的位元組。

----------------------------------------------- -------------------------------------------------- -------------------------------------------------- -------------------------------------------------- --------------------------------

slice方法也不是傳回一個新的Buffer,而更像是傳回了指向原Buffer中間的某個位置的指針,如下所示。

[ 0x68, 0x65, 0x6c, 0x6c, 0x6f ]
    ^           ^
    |           |
   bin     bin.slice(2)
因此slice方法回傳的Buffer的修改會作用於原Buffer,例如:

複製程式碼 程式碼如下:

 var buffer= new Buffer([ 0x68, 0x65, 0x6c, 0x6c, 0x6f ]) ;
 var sub = bin.slice(2) ;
 sub[0] = 0x65 ;
 console.log(buffer) ; // 

如果想要拷貝一份Buffer,得先建立一個新的Buffer,並透過.copy方法把原Buffer中的資料複製過去。

這個類似於申請一塊新的內存,並把已有內存中的資料複製過去。以下是一個例子。

複製程式碼 程式碼如下:

 var buffer= new Buffer([ 0x68, 0x65, 0x6c, 0x6c, 0x6f ]) ;
 var dup = new Buffer(bin.length) ;
 buffer.copy(dup) ;
 dup[0] = 0x48 ;
 console.log(buffer) ;  //
 console.log(dup) ;  //

總之,Buffer將JS的資料處理能力從字串擴展到了任意二進位資料。

以上簡單讓大家了解什麼是Buffer,以下具體說如何使用和具體使用場景。

二,聊聊Buffer

JavaScript對字串處理十分友好,無論是寬位元組還是單字節字串,都被認為是一個字串。 Node需要處理網路協定、操作資料庫、處理圖片、檔案上傳等,還需要處理大量二進位數據,自帶的字串遠遠不能滿足這些要求,因此Buffer應運而生。

Buffer結構

Buffer是一個典型的Javascript和C 結合的模組,性能相關部分用C 實現,非性能相關部分用javascript實現。

Node在進程啟動時Buffer就已經加裝進入內存,並將其放入全域對象,因此無需require

Buffer物件:類似數組,其元素是16進制的兩位數。

Buffer記憶體分配

Buffer物件的記憶體分配不是在V8的堆記憶體中,在Node的C 層級實現記憶體的申請。

為了高效的使用申請來得內存,Node中採用slab分配機制,slab是一種動態內存管理機制,應用各種*nix作業系統。 slab有三種狀態:

(1) full:完全分配狀態

(2) partial:部分分配狀態

(3) empty:沒有被分配狀態

Buffer的轉換
 
Buffer物件可以和字串相互轉換,支援的編碼類型如下:

ASCII、UTF-8、UTF-16LE/UCS-2、Base64、Binary、Hex

字串轉Buffer

new Buffer(str, [encoding]),預設UTF-8
buf.write(string, [offset], [length], [encoding])

Buffer轉字串

buf.toString([encoding], [start], [end])

Buffer不支援的編碼類型

透過Buffer.isEncoding(encoding)判斷是否支持

iconv-lite:純JavaScript實現,更輕,性能更好無需C 到javascript的轉換

iconv:呼叫C 的libiconv函式庫完成

Buffer的拼接

注意"res.on('data', function(chunk) {})",其中的參數chunk是Buffer對象,直接用拼接會自動轉換為字串,對於寬字節字元可能會導致亂碼產生,

解決方法:

(1) 透過可讀流中的setEncoding()方法,此方法可以讓data事件傳遞不再是Buffer對象,而是編碼後的字串,其內部使用了StringEncoder模組。

(2) 將Buffer物件暫存到陣列中,最後在組裝成一個大Buffer讓後編碼轉換為字串輸出。

Buffer在檔案I/O和網路I/O中廣泛應用,其效能舉足輕重,比普通字串效能高出很多。

Buffer的使用除了與字串的轉換有效能損耗外,在檔案讀取時候,有一個highWaterMark設定對效能影響至關重要。

a,highWaterMark設定對Buffer記憶體的分配與使用有一定影響。

b, highWaterMark設定太小,可能導致系統呼叫次數過多。

什麼時候該用buffer,什麼時候不該用  ------ 純粹的javascript支持unicode碼而對二進位不是很支持,當解決TCP流或文件流的時候,處理流是有必要的,我們保存非utf-8字串,2進位等等其他格式的時候,我們就必須得使用」Buffer“ 。

三,實例引入

複製程式碼 程式碼如下:

 var buf = new Buffer("this is text concat test !") ,str = "this is text concat test !" ;
 console.time("buffer concat test !");
 var list = [] ;
 var len = 100000 * buf.length ;
 for(var i=0;i      list.push(buf) ;
     len = buf.length ;
 }
 var s1 = Buffer.concat(list, len).toString() ;
 console.timeEnd("buffer concat test !") ;
 console.time("string concat test !") ;
 var list = [] ;
 for (var i = 100000; i >= 0; i--) {
   list.push(str) ;
 }
 var s2 = list.join("") ;
 console.timeEnd("string concat test !") ;

以下是運行結果:

讀取速度肯定string更快,buffer還需要toString()的操作。 所以我們在保存字串的時候,該用string還是要用string,就算大字串拼接string的速度也不會比buffer慢。

那什麼時候我們又需要用buffer呢?沒辦法的時候,當我們保存非utf-8字串,2進位等等其他格式的時候,我們就必須得使用了。

四,總結一下

(1),JavaScript適合處理Unicode編碼數據,但對二進位數據的處理並不友善。

(2),所以處理TCP流或檔案系統時,對八位元組流的處理很有必要。
(3),Node有幾個用於處理,創建和消耗八位元組流的方法。
(4),原始資料存放在一個Buffer實例中,一個Buffer類似一個整數數組,但是它的內存,分配在V8堆疊外。一個Buffer的大小是不能更改的。
(5),處理的編碼類型有:ascii,utf8,utf16le,ucs2(utf16le的別名),base64,binary,hex。
(6),Buffer為全域元素,直接new Buffer()就得到一個Buffer實例。

相關標籤:
來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
最新問題
node.js - nodejs效能好差
來自於 1970-01-01 08:00:00
0
0
0
NodeJS 用 ejs 傳送資料到 <script>
來自於 1970-01-01 08:00:00
0
0
0
javascript - NodeJS connect模組use的問題
來自於 1970-01-01 08:00:00
0
0
0
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板