【发布时间】:2018-08-24 12:37:41
【问题描述】:
我正在尝试从 zip 文件中读取数据
可以读取整个文本文件如下
val f = sc.wholeTextFiles("hdfs://")
但不知道如何读取 zip 文件中的文本数据
有没有什么办法,如果有请告诉我。
【问题讨论】:
-
我看到了,但没有解释清楚
-
如果它是一个 gzip 文件,它会很简单 val rdd= sc.textFile("path")
标签: scala apache-spark spark-submit spark-shell