【发布时间】:2017-01-06 21:13:18
【问题描述】:
我关注http://spark.apache.org/docs/latest/sql-programming-guide.html
输入后:
val df = spark.read.json("examples/src/main/resources/people.json")
// Displays the content of the DataFrame to stdout
df.show()
// +----+-------+
// | age| name|
// +----+-------+
// |null|Michael|
// | 30| Andy|
// | 19| Justin|
// +----+-------+
我有一些问题没有找到答案。
首先,什么是 $-notation? 如
df.select($"name", $"age" + 1).show()
第二,我可以从第二行获取数据吗(我不知道第二行的数据是什么)。
第三,如何用 spark sql 读取彩色图像?
第四,我仍然不确定 Spark 中的数据集和数据框之间有什么区别。变量 df 是一个数据框,所以我可以将“Michael”更改为整数 5 吗?我可以在数据集中这样做吗?
【问题讨论】:
标签: scala apache-spark apache-spark-sql apache-spark-dataset