【发布时间】:2016-01-20 10:06:35
【问题描述】:
我正在使用 Cloudera 的 SparkOnHBase 模块从 HBase 获取数据。
我通过这种方式得到一个 RDD:
var getRdd = hbaseContext.hbaseRDD("kbdp:detalle_feedback", scan)
基于此,我得到的是一个类型的对象
RDD[(Array[Byte], List[(Array[Byte], Array[Byte], Array[Byte])])]
对应于行键和值列表。它们都由一个字节数组表示。
如果我将 getRDD 保存到文件中,我看到的是:
([B@f7e2590,[([B@22d418e2,[B@12adaf4b,[B@48cf6e81), ([B@2a5ffc7f,[B@3ba0b95,[B@2b4e651c), ([B@27d0277a,[B@52cfcf01,[B@491f7520), ([B@3042ad61,[B@6984d407,[B@f7c4db0), ([B@29d065c1,[B@30c87759,[B@39138d14), ([B@32933952,[B@5f98506e,[B@8c896ca), ([B@2923ac47,[B@65037e6a,[B@486094f5), ([B@3cd385f2,[B@62fef210,[B@4fc62b36), ([B@5b3f0f24,[B@8fb3349,[B@23e4023a), ([B@4e4e403e,[B@735bce9b,[B@10595d48), ([B@5afb2a5a,[B@1f99a960,[B@213eedd5), ([B@2a704c00,[B@328da9c4,[B@72849cc9), ([B@60518adb,[B@9736144,[B@75f6bc34)])
对于每条记录(rowKey 和列)
但我需要的是获取所有和每个键和值的字符串表示。或者至少是价值观。为了将其保存到文件并查看类似
key1,(value1,value2...)
或类似的东西
key1,value1,value2...
我对 spark 和 scala 完全陌生,而且很难获得一些东西。
你能帮我解决这个问题吗?
【问题讨论】:
标签: scala apache-spark hbase