【问题标题】:how can I read table hive in a .orc file?如何读取 .orc 文件中的表配置单元?
【发布时间】:2018-10-26 03:42:01
【问题描述】:

我有一个 .orc 文件,有没有办法将其转换为 .csv 文件?还是有其他方法可以读取此文件中的表格?

【问题讨论】:

  • 读表是什么意思? select * from table ?

标签: hadoop hive orc


【解决方案1】:

您可以使用以下命令读取 ORC 文件的内容

hive --orcfiledump -d <path_of_orc_file_in_hdfs>

它将内容作为json返回。

【讨论】:

    【解决方案2】:

    Hive 具有原生的ORC 支持,因此您可以通过 Hive 直接读取它。

    插图:

    (比如说,文件名为myfile.orc

    上传文件到 HDFS

    hadoop fs -mkdir hdfs:///my_table_orc_file
    hadoop fs -put myfile.orc hdfs:///my_table_orc_file
    

    在其上创建 Hive 表

    (更新列定义以匹配数据)

    CREATE EXTERNAL TABLE `my_table_orc`(
      `col1` string,
      `col2` string)
    STORED AS ORC
    LOCATION
      'hdfs:///my_table_orc_file';
    

    查询

    select * from my_table_orc;
    

    【讨论】:

      猜你喜欢
      • 2018-10-19
      • 2020-08-14
      • 1970-01-01
      • 2015-11-25
      • 2017-01-20
      • 1970-01-01
      • 2015-12-19
      • 2016-08-26
      • 2021-08-01
      相关资源
      最近更新 更多