【发布时间】:2017-12-04 18:05:37
【问题描述】:
我正在尝试创建一个非常简单的 DataFrame,例如 3 列和 3 行。
我想要这样的东西:
+------+---+-----+
|nameID|age| Code|
+------+---+-----+
|2123 | 80| 4553|
|65435 | 10| 5454|
+------+---+-----+
如何在 Scala 中创建该数据框(示例)。 我有下一个程序:
import org.apache.spark.sql._
import org.apache.spark.sql.types._
object ejemploApp extends App{
val schema = StructType(List(
StructField("name", LongType, true),
StructField("pandas", LongType, true),
StructField("id", LongType, true)))
}
val outputDF = sqlContext.createDataFrame(sc.emptyRDD, schema)
第一个问题: 它在 outputDF 中抛出错误,无法解析符号模式。
第二个问题: 如何将随机数添加到 DataFrame?
【问题讨论】:
-
@cheseaux 这不是我创建 DataFrame 的想法。我想从cero创建它,而不是从字符串或列表。
-
从零开始是什么意思?
-
@cheseaux 我已经更新了问题,你能检查一下吗?谢谢!
-
你的项目中有spark sql dependency吗?
-
不,我没有,我只是现在导入它,它可以工作:) @RameshMaharjan 谢谢!
标签: scala apache-spark spark-dataframe