【发布时间】:2020-02-28 02:41:43
【问题描述】:
我有 Array[Byte] 形式的数据,我想将其转换为 Spark RDD 或 DataFrame,以便我可以将我的数据以文件的形式直接写入 Google 存储桶。我无法将 Array[Byte] 数据直接写入 Google 存储桶。所以寻找这种转换。
我下面的代码能够将数据写入本地 FS,但不能写入谷歌存储桶
val encrypted = encrypt(original, readPublicKey(pubKey), outFile, true, true)
val dfis = new FileOutputStream(outFile)
dfis.write(encrypted)
dfis.close()
def encrypt(clearData: Array[Byte], encKey: PGPPublicKey, fileName: String, withIntegrityCheck: Boolean, armor: Boolean): Array[Byte] = {
...
}
那么如何将 Array[Byte] 数据转换为 RDD 或 DataFrame?我正在使用 Scala。
【问题讨论】:
标签: scala apache-spark