【发布时间】:2016-01-04 19:48:34
【问题描述】:
我尝试使用 Spark 和 Cassandra Spark 连接器将流数据保存到 Cassandra。
我做了如下的事情:
创建一个模型类:
public class ContentModel {
String id;
String available_at; //may be null
public ContentModel(String id, String available_at){
this.id=id;
this.available_at=available_at,
}
}
将流式内容映射到模型:
JavaDStream<ContentModel> contentsToModel = myStream.map(new Function<String, ContentModel>() {
@Override
public ContentModel call(String content) throws Exception {
String[] parts = content.split(",");
return new ContentModel(parts[0], parts[1]);
}
});
保存:
CassandraStreamingJavaUtil.javaFunctions(contentsToModel).writerBuilder("data", "contents", CassandraJavaUtil.mapToRow(ContentModel.class)).saveToCassandra();
如果某些值为null,我会收到以下错误:
com.datastax.spark.connector.types.TypeConversionException: Cannot convert object null to struct.ValueRepr.
有没有办法使用 Spark Cassandra 连接器存储空值?
【问题讨论】:
标签: java cassandra apache-spark