【问题标题】:Does cdh5.1.2 support Parquet file formatcdh5.1.2是否支持Parquet文件格式
【发布时间】:2017-06-29 11:20:13
【问题描述】:

Cloudera 5.1.2 是否支持 Parquet 文件格式..

Hadoop 2.3.0-cdh5.1.2

我们在 cloudera 网站上是否有一些兼容性

【问题讨论】:

  • Parquet 由 Cloudera(和 Twitter)开发。您可以在 Unix 系统上使用/安装parquet-tools
  • @philantrovert 我现在明白了,如果它支持镶木地板,我更倾向于在这个版本的 hadoop 中编写镶木地板文件不需要额外的包
  • @philantrovert parquet-tools 它是如何工作的,我可以在 cloudera 上安装它吗?是否需要,到目前为止,我可以读取我使用 spark-sql 的文件

标签: hadoop cloudera cloudera-cdh parquet file-format


【解决方案1】:

是的。在 CDH5.1 的发行说明中,它提到:

Apache Hive

  • 权限继承修复
  • 支持十进制计算,以及从 Parquet 和 Avro 读取和写入十进制格式数据

在“Cloudera 搜索”下:

  • 此版本的 Kite 0.10.0 包含对 Parquet 文件格式的支持。

所以支持。

在 CDH5.1.2 (RedHat 6.x) 的 CDH 存储库下,您还会看到以下包:

parquet-1.2.5+cdh5.1.2+136-1.cdh5.1.2.p0.2.el6.noarch.rpm 2014-08-27 22:40 10M

因此,CDH5.1.2 支持 parquet 版本 1.2.5。

http://www.cloudera.com/documentation/cdh/5-1-x/CDH5-Release-Notes/cdh5rn_new_in_510.html http://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/5.1.2/RPMS/noarch/

【讨论】:

  • 谢谢,我们已经开始用相同版本的 hadoop 编写 parquet 文件了
猜你喜欢
  • 1970-01-01
  • 2017-01-10
  • 2016-01-26
  • 1970-01-01
  • 2016-09-07
  • 1970-01-01
  • 2013-03-22
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多