【发布时间】:2020-01-06 18:12:08
【问题描述】:
我有一个需要在 spark ( java ) 中解析的事件流(格式如下)。我能够读取流,但无法找到将消息转换为 java bean 的示例。
{
user_id : string,
session_id : string,
event : string,
page : string,
timestamp : timestamp
}
Java 豆
public class Event implements Serializable {
private String user_id;
private String session_id;
private String page;
private String event;
private Timestamp timestamp;
}
将消息读取为字符串的代码。
Dataset<String> lines = spark
.readStream()
.format("kafka")
.option("kafka.bootstrap.servers", "localhost:9092")
.option("subscribe", topics)
.load()
.selectExpr("CAST(value AS STRING)")
.as(Encoders.STRING());
【问题讨论】:
标签: apache-spark apache-spark-sql spark-streaming