【发布时间】:2016-04-26 03:11:51
【问题描述】:
可以从 spark 的单个 DStream 中获取多个 DStream。 我的用例如下:我从 HDFS 文件中获取日志数据流。 日志行包含一个 id (id=xyz)。 我需要根据 id 以不同的方式处理日志行。 所以我试图为输入 Dstream 中的每个 id 设置不同的 Dstream。 我在文档中找不到任何相关内容。 有谁知道如何在 Spark 中实现这一点或指向任何链接。
谢谢
【问题讨论】:
标签: apache-spark spark-streaming dstream