【发布时间】:2025-11-23 06:35:01
【问题描述】:
我是 Spark 和 Scala 的新手。我使用 Spark Streaming 编写了一个程序,用于在 Twitter 上获取主题标签或推文。我的代码是这样的:
val conf = new SparkConf().setMaster("local[2]").setAppName("SparkTwitterHelloWorldExample");
val jssc = new StreamingContext(conf, new Duration(1000));
System.setProperty("twitter4j.oauth.consumerKey", consumerKey);
System.setProperty("twitter4j.oauth.consumerSecret", consumerSecret);
System.setProperty("twitter4j.oauth.accessToken", accessToken);
System.setProperty("twitter4j.oauth.accessTokenSecret", accessTokenSecret);
val twitterStream=TwitterUtils.createStream(jssc, None, Array("#Spark"))
// Without filter: Output text of all tweets
val statuses = twitterStream.map{ status => status.getText() }
val hashTags = statuses.filter(word => word.startsWith("#Spark"))
val tagCounts = hashTags.window(Seconds(100), Seconds(10)).countByValue()
hashTags.count().print();
tagCounts.count().print();
jssc.start();
这段代码总是打印0,不知为什么?有知道的可以帮忙看看吗,谢谢
【问题讨论】:
标签: scala twitter apache-spark