【发布时间】:2017-03-09 18:21:37
【问题描述】:
以下代码将从文件中提取数据并使用逗号分隔符分割数据。
val a=sc.textFile("/sparkinput")
val b=a.map(x=>x.split(","))
b.collect
输出:
Array(Array(1, Brandon Buckner, avil, female, 525), Array(2, Veda Hopkins, avil, male, 633), Array(3, Zia Underwood, paracetamol, male, 980), Array(4, Austin Mayer, paracetamol, female, 338), Array(5, Mara Higgins, avil, female, 153), Array(6, Sybill Crosby, avil, male, 193), Array(7, Tyler Rosales, paracetamol, male, 778), Array(8, Ivan Hale, avil, female, 454), Array(9, Alika Gilmore, paracetamol, female, 833), Array(10, Len Burgess, metacin, male, 325))
b.saveasTextFile("/sparkoutput")
当我将输出保存在文本文件中时,不确定为什么我会得到如下数据。
输出:
[Ljava.lang.String;@45968fc2
[Ljava.lang.String;@6b3012a2
[Ljava.lang.String;@211780a8
[Ljava.lang.String;@dffa691
[Ljava.lang.String;@b1080c5
[Ljava.lang.String;@68760b2f
[Ljava.lang.String;@1dd8703d
我是 spark 新手,请帮助我。
【问题讨论】:
标签: apache-spark transformation