【发布时间】:2016-11-04 08:44:15
【问题描述】:
我正在开发一个需要与 C++ tcp/udp 套接字通信的 javascript/nodejs 应用程序。好像我从旧的 C++ 客户端获得了一个 utf16 缓冲区。我现在没有找到将其转换为可读字符串的解决方案,而另一个方向似乎是同样的问题。
这两个方向有简单的方法吗?
问候
【问题讨论】:
标签: javascript node.js
我正在开发一个需要与 C++ tcp/udp 套接字通信的 javascript/nodejs 应用程序。好像我从旧的 C++ 客户端获得了一个 utf16 缓冲区。我现在没有找到将其转换为可读字符串的解决方案,而另一个方向似乎是同样的问题。
这两个方向有简单的方法吗?
问候
【问题讨论】:
标签: javascript node.js
如果您有一个 UTF-16 编码的缓冲区,您可以将其转换为 UTF-8 字符串,如下所示:
let string = buffer.toString('utf16le');
要从流中读取这些,最简单的方法是在最后使用转换为字符串:
let chunks = [];
stream.on('data', chunk => chunks.push(chunk))
.on('end', () => {
let buffer = Buffer.concat(chunks);
let string = buffer.toString('utf16le');
...
});
将 JS 字符串转换为 UTF-16:
let buffer = Buffer.from(string, 'utf16le')
【讨论】:
.toString('utf16le'); 在通过 GSM SMS 消息发送重音字母时特别有用
单缓冲区
如果您有一个 Buffer,您可以使用它的 toString 方法,该方法将使用特定编码将全部或部分二进制内容转换为字符串。如果您不提供参数,则默认为 utf8,但我在此示例中明确设置了编码。
var req = http.request(reqOptions, function(res) { ...
res.on('data', function(chunk) {
var textChunk = chunk.toString('utf8');
// process utf8 text chunk
});
});
流式缓冲区
如果您在上面的问题中具有流式缓冲区,其中多字节 UTF8 字符的第一个字节可能包含在第一个缓冲区(块)中,第二个字节包含在第二个缓冲区中,那么您应该使用 StringDecoder。 :
var StringDecoder = require('string_decoder').StringDecoder;
var req = http.request(reqOptions, function(res) { ... var decoder = new StringDecoder('utf8');
res.on('data', function(chunk) {
var textChunk = decoder.write(chunk);
// process utf8 text chunk
});
}); 如果您有一个 Buffer,您可以使用其 toString 方法,该方法将使用特定编码将全部或部分二进制内容转换为字符串。如果您不提供参数,则默认为 utf8,但我在此示例中明确设置了编码。
var req = http.request(reqOptions, function(res) { ...
res.on('data', function(chunk) {
var textChunk = chunk.toString('utf8');
// process utf8 text chunk
});
});
【讨论】: