【发布时间】:2016-05-13 12:58:22
【问题描述】:
我有一个 mapreduce 程序,我想在 parquet 文件中使用它。我无法在任何 repo 或站点上找到任何 parquet 示例数据集。
请推荐一些。
【问题讨论】:
标签: java mapreduce dataset parquet bigdata
我有一个 mapreduce 程序,我想在 parquet 文件中使用它。我无法在任何 repo 或站点上找到任何 parquet 示例数据集。
请推荐一些。
【问题讨论】:
标签: java mapreduce dataset parquet bigdata
我想你可能只是写一个 MR 来读取一个 dfs 文件并写成一个 parquet 文件。
命令:
使用 ALTER 命令设置 store.format 选项。
ALTER SESSION SET `store.format` = 'parquet';
ALTER SYSTEM SET `store.format` = 'parquet';
【讨论】: