【发布时间】:2017-02-14 20:48:21
【问题描述】:
我们有一个大约 10 亿行的 Impala 表和一个 Double 类型的值列。当我们在同一张表上连续多次运行相同的“select {dimensions}, sum(value) from table group by {dimensions}”查询时,每次得到的总和都略有不同。当我们对四舍五入的值求和时也会发生这种情况。这种可变性的原因可能是什么?有没有办法解决这个问题?
【问题讨论】:
标签: hadoop cloudera-cdh impala