這篇文章主要介紹了Nodejs進階之服務端字元編解碼和亂碼處理,具有一定的參考價值,有興趣的小夥伴們可以參考一下
##寫在前面
在web服務端開發中,字元的編解碼幾乎每天都要打交道。編解碼一旦處理不當,就會出現令人頭痛的亂碼問題。 不少從事node服務端開發的同學,由於對字元編碼碼相關知識了解不足,遇到問題時,經常會一籌莫展,花大量的時間在排查、解決問題。 文字先對字元編解碼的基礎知識進行簡單介紹,然後舉例說明如何在node中進行編解碼,最後是服務端的程式碼案例。本文相關程式碼範例可在這裡找到。關於字元編解碼
在網路通訊的過程中,傳輸的都是二進位的位元位,不管發送的內容是文字還是圖片,採用的語言是中文還是英文。 舉個例子,客戶端向服務端發送"你好"。客戶端 --- 你好 ---> 服務端
關於字元集和字元編碼
上面提到字元、二進位的轉換問題。既然兩者可以互相轉換,也就是說有明確的轉換規則,可以實現字元<->二進位的相互轉換。 這裡提到的轉換規則,其實就是我們常聽到的字元集&字元編碼。 字元集是一系列字元(文字、標點符號等)的集合。字元集有很多,常見的有ASCII、Unicode、GBK等。不同字元集主要的差異在於包含字元個數的不同。 了解了字元集的概念後,接下來介紹下字元編碼。 字符集告訴我們支援哪些字符,但具體字符怎麼編碼,是由字符編碼決定的。例如Unicode字元集,支援的字元編碼有UTF8(常用)、UTF16、UTF32。 概括一下:字元編解碼範例
上面已經提到了字元編解碼所需的基礎知識。下面我們來看一個簡單的例子,這裡藉助了icon-lite這個函式庫來幫助我們實作編解碼的操作。 可以看到,當字元編碼時,我們採用了gbk。在解碼時,如果同樣採用gbk,可以得到原始的字元。而當我們解碼時採用utf8時,則出現了亂碼。var iconv = require('iconv-lite'); var oriText = '你'; var encodedBuff = iconv.encode(oriText, 'gbk'); console.log(encodedBuff); // <Buffer c4 e3> var decodedText = iconv.decode(encodedBuff, 'gbk'); console.log(decodedText); // 你 var wrongText = iconv.decode(encodedBuff, 'utf8'); console.log(wrongText); // ��
實際範例:服務端編解碼
通常我們需要處理編解碼的場景有檔案讀寫、網路請求處理。這裡距網路請求的例子,介紹如何在服務端進行編解碼。 假設我們執行以下http服務,監聽來自客戶端的請求。客戶端傳輸資料時採用了gbk編碼,而服務端預設採用的是
utf8編碼。
utf8對請求進行解碼,就會出現亂碼,因此需要特殊處理。
var http = require('http'); var iconv = require('iconv-lite'); // 假设客户端采用post方法,编码为gbk var server = http.createServer(function (req, res) { var chunks = []; req.on('data', function (chunk) { chunks.push(chunk) }); req.on('end', function () { chunks = Buffer.concat(chunks); // 对二进制进行解码 var body = iconv.decode(chunks, 'gbk'); console.log(body); res.end('HELLO FROM SERVER'); }); }); server.listen(3000);
var http = require('http'); var iconv = require('iconv-lite'); var charset = 'gbk'; // 对字符"你"进行编码 var reqBuff = iconv.encode('你', charset); var options = { hostname: '127.0.0.1', port: '3000', path: '/', method: 'POST', headers: { 'Content-Type': 'text/plain', 'Content-Encoding': 'identity', 'Charset': charset // 设置请求字符集编码 } }; var client = http.request(options, function(res) { res.pipe(process.stdout); }); client.end(reqBuff);
以上是Nodejs中服務端字元編解碼與亂碼處理方法介紹的詳細內容。更多資訊請關注PHP中文網其他相關文章!