认证0级讲师
你说的是unicode字符码还是utf-8字符码。如果是unicode字符码,就是类似于:
\u6c49\u5b57
这种样子的就直接存吧。但是如果是
汉字
这样的字符码,那你还是转成汉字存储吧。
具体的编码问题可以看看这个链接:https://www.zhihu.com/questio...
因为js只有一种字符串类型。这个类型是UCS-2/UTF-16的,只有用Blob或Buffer才能真正保存UTF-8编码的数据。所以你通过网页爬虫读取到的GB2312数据应该直接转换为js内部字符串,然后利用fs的API保存时指定上utf-8编码。这样对应的模块在保存时进行转换。如果你想自己转换,那么结果只能放在Buffer里,再写文件。
你说的是unicode字符码还是utf-8字符码。
如果是unicode字符码,就是类似于:
这种样子的就直接存吧。
但是如果是
这样的字符码,那你还是转成汉字存储吧。
具体的编码问题可以看看这个链接:
https://www.zhihu.com/questio...
因为js只有一种字符串类型。这个类型是UCS-2/UTF-16的,只有用Blob或Buffer才能真正保存UTF-8编码的数据。所以你通过网页爬虫读取到的GB2312数据应该直接转换为js内部字符串,然后利用fs的API保存时指定上utf-8编码。这样对应的模块在保存时进行转换。
如果你想自己转换,那么结果只能放在Buffer里,再写文件。