【发布时间】:2018-01-29 15:09:39
【问题描述】:
我试图在 Spark 1.6.0 中创建一个数据框。 我用这个命令来创建它:-
val df = sqlContext.read.format("com.databricks.spark.csv")
.option("header","true")
.option("delimiter",",")
.option("inferSchema","true")
.load("/user/rohitchopra32_gmail/Project1_dataset_bank-full(2).csv")
它创建了一个数据框,但是当我尝试使用df.show() 命令时,它显示不完整且未格式化的数据,例如
以及当我尝试使用val selectedData = df.select("age") 选择数据时
命令它显示错误
链接到我的数据集:-data set
我是 spark 新手,我不知道是什么导致了这个错误。 我错过了什么吗?
【问题讨论】:
-
分隔符不应该是
;吗? -
是的,我也同意@Psidom
-
不,它不会改变任何东西
-
是spark版本的原因吗?我正在使用 1.6.0
-
您共享的 CSV 格式不正确...
标签: scala csv apache-spark apache-spark-sql