【发布时间】:2014-12-16 23:25:48
【问题描述】:
我正在使用 Spark 将数据从文本文件导入 CQL 表(在 DataStax 上)。我已经用一个所有变量都是字符串的文件成功地做到了这一点。我首先使用 CQL 创建了表,然后在 Spark shell 中使用 Scala 运行:
val file = sc.textFile("file:///home/pr.txt").map(line => line.split("\\|").map(_.toString));
file.map(line => (line(0), line(1))).saveToCassandra("ks", "ks_pr", Seq("proc_c", "proc_d"));
我要导入的其余文件包含多种变量类型。我已经使用 CQL 设置了表并在那里指定了适当的类型,但是在 spark 中导入文本文件时如何转换它们?
【问题讨论】:
标签: scala cassandra apache-spark cql datastax-enterprise