【发布时间】:2018-10-26 03:42:01
【问题描述】:
我有一个 .orc 文件,有没有办法将其转换为 .csv 文件?还是有其他方法可以读取此文件中的表格?
【问题讨论】:
-
读表是什么意思?
select * from table?
我有一个 .orc 文件,有没有办法将其转换为 .csv 文件?还是有其他方法可以读取此文件中的表格?
【问题讨论】:
select * from table ?
您可以使用以下命令读取 ORC 文件的内容
hive --orcfiledump -d <path_of_orc_file_in_hdfs>
它将内容作为json返回。
【讨论】:
Hive 具有原生的ORC 支持,因此您可以通过 Hive 直接读取它。
插图:
(比如说,文件名为myfile.orc)
上传文件到 HDFS
hadoop fs -mkdir hdfs:///my_table_orc_file
hadoop fs -put myfile.orc hdfs:///my_table_orc_file
在其上创建 Hive 表
(更新列定义以匹配数据)
CREATE EXTERNAL TABLE `my_table_orc`(
`col1` string,
`col2` string)
STORED AS ORC
LOCATION
'hdfs:///my_table_orc_file';
查询
select * from my_table_orc;
【讨论】: