认证0级讲师
你說的是unicode字碼還是utf-8字碼。 如果是unicode字碼,就是類似:
\u6c49\u5b57
這種樣子的就直接存吧。 但是如果是
汉字
這樣的字碼,那你還是轉成漢字儲存吧。
具體的程式設計問題可以看看這個連結:https://www.zhihu.com/questio...
因為js只有一種字串型別。這個類型是UCS-2/UTF-16的,只有用Blob或Buffer才能真正保存UTF-8編碼的資料。所以你透過網頁爬蟲讀取到的GB2312資料應該直接轉換為js內部字串,然後利用fs的API儲存時指定上utf-8編碼。這樣對應的模組在儲存時會進行轉換。 如果你想要自己轉換,那麼結果就只能放在Buffer裡,再寫檔案。
你說的是unicode字碼還是utf-8字碼。
如果是unicode字碼,就是類似:
這種樣子的就直接存吧。
但是如果是
這樣的字碼,那你還是轉成漢字儲存吧。
具體的程式設計問題可以看看這個連結:
https://www.zhihu.com/questio...
因為js只有一種字串型別。這個類型是UCS-2/UTF-16的,只有用Blob或Buffer才能真正保存UTF-8編碼的資料。所以你透過網頁爬蟲讀取到的GB2312資料應該直接轉換為js內部字串,然後利用fs的API儲存時指定上utf-8編碼。這樣對應的模組在儲存時會進行轉換。
如果你想要自己轉換,那麼結果就只能放在Buffer裡,再寫檔案。