【问题标题】:HBase and HDFS data delimiters?HBase 和 HDFS 数据分隔符?
【发布时间】:2013-09-19 02:04:45
【问题描述】:

我将 HBase 数据导出到 HDFS。我想 SqoopHDFS 导出到 MySQL。但是在使用 Sqoop 导出时,需要我提供 HDFS 数据的分隔方式。如何检查 HBase 表或 HDFS 数据中的分隔符?

编辑 1:我将 HBase 数据导出到 HDFS 使用 bin/hadoop jar /path/to/hbase-0.20.3.jar export your_table /export/your_table

【问题讨论】:

    标签: hadoop hbase hdfs sqoop


    【解决方案1】:

    就 HBase 而言,没有任何分隔符的问题。您的数据存储在 HBase 表的列中。要知道 HDFS 文件的分隔符,您可以:

    • 使用 bin/hadoop fs -cat /path/to/file
    • 通过 HDFS WebUI 浏览文件并通过查看其内容找到它。

    但这主要取决于您如何导出数据。 例如,如果您使用了 HBase 导出实用程序,那么您的数据将作为序列文件转储到 HDFS。

    【讨论】:

    • 嗨塔里克!请参阅我更新后的问题“编辑 1:”,它解释了我如何将 HBase 导出到 HDFS
    • 正如我在上面指定的 export 实用程序将数据导出为序列文件。有关序列文件的更多信息,请参阅此:wiki.apache.org/hadoop/SequenceFile
    猜你喜欢
    • 2015-12-21
    • 1970-01-01
    • 2012-01-28
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-06-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多