【问题标题】:Impala queries are not returning anything error or data nothing at allImpala 查询没有返回任何错误或数据什么都没有
【发布时间】:2016-03-17 16:44:42
【问题描述】:

我创建了 Impala PARQUET TABLE OF 50GB 数据。 我正在运行一个包含 5 个表的连接、数据分组和排序的查询。

在查询结束时,服务器没有响应任何输出数据,也没有任何异常被 Impala 抛出。

在 cloudera 管理器上,我可以看到一个节点在几分钟后运行状况不佳。

查询:

    select 
    d_year, s_city, p_brand1,
    sum(lo_revenue - lo_supplycost) as profit
from 
    lineorder_kylin_parqt_ext, dates_kylin_parqt_ext ,customer_kylin_parqt_ext, supplier_kylin_parqt_ext, part_kylin_parqt_ext
where 
    lo_custkey = c_custkey
    and lo_suppkey = s_suppkey
    and lo_partkey = p_partkey
    and lo_orderdate = d_datekey
    and c_region = 'AMERICA'
    and s_nation = 'UNITED STATES'
    and (d_year = 1997 or d_year = 1998)
    and p_category = 'MFGR#14'
group by 
    d_year, s_city, p_brand1
order by 
    d_year, s_city, p_brand1;

【问题讨论】:

  • 没有回应是什么意思?您是否肯定查询应该返回数据,即谓词可能不选择任何行?此外,当您说“在 cloudera 管理器上,我可以看到一个节点运行状况不佳”时,它报告的运行状况不佳是什么?
  • 那个节点角色会重新启动,是的,它应该返回一些输出,我得到的答案是操作系统正在杀死节点上的黑斑羚恶魔,因为它正在消耗大量内存。

标签: cloudera impala


【解决方案1】:

我得到了答案操作系统正在杀死节点上的黑斑羚恶魔,因为它正在吃内存。我从内核日志和 Cloudera Manager 以及执行查询的恶魔中确认了这一点。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-05-11
    • 2018-08-16
    • 2011-11-07
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多