【发布时间】:2017-10-15 15:51:26
【问题描述】:
我正在尝试使用以下代码从 pub/sub 读取
Read<String> pubsub = PubsubIO.<String>read().topic("projects/<projectId>/topics/<topic>").subscription("projects/<projectId>/subscriptions/<subscription>").withCoder(StringUtf8Coder.of()).withAttributes(new SimpleFunction<PubsubMessage,String>() {
@Override
public String apply(PubsubMessage input) {
LOG.info("hola " + input.getAttributeMap());
return new String(input.getMessage());
}
});
PCollection<String> pps = p.apply(pubsub)
.apply(
Window.<String>into(
FixedWindows.of(Duration.standardSeconds(15))));
pps.apply("printdata",ParDo.of(new DoFn<String, String>() {
@ProcessElement
public void processElement(ProcessContext c) {
LOG.info("hola amigo "+c.element());
c.output(c.element());
}
}));
与我在 NodeJS 上收到的相比,我收到的消息将包含在 data 字段中。我怎样才能得到ackId 字段(我以后可以用它来确认消息)?我正在打印的属性映射是null。
有没有其他方法可以确认所有消息而无需找出 ackId?
【问题讨论】:
-
我使用的是 v0.6.0
-
您使用的是哪个跑步者?我认为
PubsubIO.read()应该在消息成功处理后为您确认消息——您确定有必要自己确认吗? -
我正在使用 flink-runner。消息似乎没有得到确认,但我会再次检查。
-
我再次检查,消息肯定没有得到确认。但是我错误地认为 ackId 会在属性中 - 属性映射值是正确的。所以我只需要知道如何让我的消息得到确认。
-
PubsubIO阅读器负责确认消息。我相信它与跑步者的检查点行为有关。具体来说,源将仅在读出的元素已被检查点时确认。你是如何配置 flink-runner 的 checkpointing 行为的?
标签: java google-cloud-pubsub apache-beam apache-beam-io