【发布时间】:2016-04-27 07:43:40
【问题描述】:
我正在使用 creatDirectStream 来集成 SparkStreaming 和 Kafka。这是我使用的代码:
val ssc = new StreamingContext(new SparkConf, Seconds(10))
val kafkaParams = Map("metadata.broker.list" -> "sandbox:6667")
val topics = Set("topic1")
val messages = KafkaUtils.createDirectStream[String, String, StringDecoder, StringDecoder](
ssc, kafkaParams, topics)
现在我想将消息存储到 HDFS 中。这样做对吗?
messages.saveAsTextFiles("/tmp/spark/messages")
【问题讨论】:
标签: apache-spark hdfs apache-kafka