【问题标题】:Combiner function in Apache Hadoop with GoraApache Hadoop 与 Gora 中的组合器功能
【发布时间】:2019-01-02 09:17:57
【问题描述】:

我有一个简单的 Hadoop、Nutch 2.x、Hbase 集群。我必须写一个能找到一些统计数据的 MR 工作。这是两步工作,即我认为我也需要组合器功能。在简单的 Hadoop 作业中,这不是一个大问题,因为给出了很多指南,例如 this one。但我找不到任何将组合器与 Gora 一起使用的选项。我的统计数据将被添加到 Hbase 的页面中,这就是为什么我无法了解 Gora(我认为)。以下是我希望添加 com 的代码 sn-p

GoraMapper.initMapperJob(job, query, pageStore, Text.class, WebPage.class,
        My_Mapper.class, null, true);


    job.setNumReduceTasks(1);

    // === Reduce ===
    DataStore<String, WebPage> hostStore = StorageUtils.createWebStore(
        job.getConfiguration(), String.class, WebPage.class);
    GoraReducer.initReducerJob(job, hostStore, My_Reducer.class);

【问题讨论】:

    标签: java hadoop nutch gora nutch2


    【解决方案1】:

    我从未在 Gora 中使用过组合器,但它是否有效(或者它显示了什么错误)?:

    GoraReducer.initReducerJob(job, hostStore, My_Reducer.class);
    job.setCombinerClass(My_Reducer.class);
    

    编辑:在Apache's Jira about the Combiner 创建了一个问题。

    【讨论】:

    • 我已经对其进行了测试,但在这种情况下,在组合器部分和减速器部分未执行后,作业被标记为完成
    猜你喜欢
    • 1970-01-01
    • 2013-05-09
    • 2015-03-24
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2015-11-13
    • 2023-04-10
    相关资源
    最近更新 更多