【发布时间】:2015-09-07 10:45:54
【问题描述】:
我是 Spark 的新手,我有这样的 Spark 脚本
import org.apache.spark.SparkContext
/**
* Loading sales csv using DataFrame API
*/
object CsvDataInput {
def main(args: Array[String]) {
val sc = new SparkContext(args(0), "Csv loading example")
val sqlContext = new org.apache.spark.sql.SQLContext(sc)
val df = sqlContext.load("com.databricks.spark.csv", Map("path" -> args(1),"header"->"true"))
df.printSchema()
df.registerTempTable("sales")
val aggDF = sqlContext.sql("select sum(amt),code from sales where tran='CHG' group by amt,code")
println(aggDF.collectAsList())
}
}
如何在 cloudera 中执行该程序 我必须使用什么命令
我使用了这个命令
./bin/spark-shell --class classname --master local "Scriptpath" 输入路径
但我没有得到输出。
【问题讨论】:
标签: java hadoop apache-spark apache-spark-sql