【发布时间】:2018-09-14 14:49:58
【问题描述】:
我有一个简单的管道,可以在固定窗口中从 pubsub 读取数据,解析消息并按特定属性对它们进行分组。但是,如果我在 groupBy 之后 map 我的函数似乎没有被执行。
我错过了什么吗?
sc.pubsubSubscription[String](s"projects/$project/subscriptions/$subscription")
.withFixedWindow(Duration.standardSeconds(windowSeconds))
.map(parseMessage)
.groupBy(_.ip_address)
.map(entry => log.info(s"${entry._1} was repeated ${entry._2.size} times"))
【问题讨论】:
-
你能谈谈你是如何测试这个的吗?您可以使用 Beam 的 TestStream 接口对此进行测试。