【发布时间】:2020-05-07 19:56:34
【问题描述】:
我想通过读取来自 csv 文件的输入来创建一个 Spark 数据框(不带双引号),如下所述。
这是我的代码,但目前没有用。
val empDF = spark.read.format("com.databricks.spark.csv")
.option("header", "true")
.option("inferSchema", "true")
.option("quote", "\"")
.option("escape", "\"")
.load("EmpWithQuotes.csv")
.toDF()
我的预期输出不是在输出中添加双引号,但我得到一个带有垃圾的输出。
+---+-----+----------+----+
|eno|ename| eloc|esal|
+---+-----+----------+----+
| 11|�abx�| �chennai�|1000|
| 22|�abr�| �hyd�|3000|
【问题讨论】:
-
是否可以发布准确的数据而不是图片?
标签: apache-spark pyspark apache-spark-sql