【发布时间】:2016-10-02 14:12:54
【问题描述】:
我正在尝试使用 Kafka 9 中的 SimpleConsumer 来允许用户从时间偏移中重播事件 - 但我从 Kafka 收到的消息采用非常奇怪的编码:
7icf-test-testEvent.ebebf1a4.2911.431d.a138.f5d6db4647d7\�W>8������{"namespace":"test","type":"testEvent.ebebf1a4.2911.431d.a138.f5d6db4647d7","received":1464819330373,"context":{"userid":0,"username":"testUser"}}�!}�a�����{"namespace":"test","type":"testEvent.ebebf1a4.2911.431d.a138.f5d6db4647d7","received":1464819331637,"context":{"userid":1,"username":"testUser"}}���r�����{"namespace":"test","type":"testEvent.ebebf1a4.2911.431d.a138.f5d6db4647d7","received":1464819332754,"context":{"userid":2,"username":"testUser"}}��������{"namespace":"test","type":"testEvent.ebebf1a4.2911.431d.a138.f5d6db4647d7","received":1464819333868,"context":{"userid":3,"username":"testUser"}}�p=
������{"namespace":"test","type":"testEvent.ebebf1a4.2911.431d.a138.f5d6db4647d7","received":1464819334997,"context":{"userid":4,"username"
使用 KafkaConsumer 可以很好地解析此消息。这是我使用 SimpleConsumer 检索消息的代码:
for (MessageAndOffset messageAndOffset : fetchResponse.messageSet(topic, partition)) {
long currentOffset = messageAndOffset.offset();
if (currentOffset < readOffset) {
log.debug("Found an old offset - skip");
continue;
}
readOffset = messageAndOffset.nextOffset();
int payloadOffset = 14 + messageAndOffset.message().keySize(); // remove first x bytes, schema Id
byte[] data = messageAndOffset.message().payload().array();
byte[] realData = Arrays.copyOfRange(data, payloadOffset, data.length - payloadOffset);
log.debug("Read " + new String(realData, "UTF-8"));
}
在我不断收到有关字节太高的 UTF-32 错误后,我添加了代码以跳过前 x 个字节,我认为这是因为 Kafka 将消息大小等信息预先添加到了有效负载中。这是 Avro 神器吗?
【问题讨论】:
-
看起来不像 Avro——至少不是二进制 Avro 编码。在二进制编码中,您不会在记录中获得架构信息。
-
我的代码略有不同——我没有使用
payload().array(),而是按照这里的方式进行操作:cwiki.apache.org/confluence/display/KAFKA/… 例如:payload().get(bytes)其中bytes的类型为@987654327 @。get()方法复制数据,而array()返回实际数组,在ByteBuffer的 Javadocs 中它说:“修改此缓冲区的内容将导致修改返回的数组的内容,反之亦然。”也许这样的事情正在发生? -
@Gandalf 请您仅在记事本++ 中打开您的消息。如果您使用其他写字板或记事本打开它,那么它看起来会很危险。所以用记事本++打开它,让我们知道。
标签: java apache-kafka kafka-consumer-api