【发布时间】:2020-01-29 04:08:16
【问题描述】:
我正在尝试学习更多关于大数据的知识,尤其是在使用 Hadoop 和 Spark 方面。但是,我一直看到“中间结果”这个词,我不太确定它指的是什么。
例如,我读到“Hadoop 将中间结果写入计算机的存储磁盘,而 Spark 则尽可能将这些相同的结果保存在内存中。”我假设这是指 Map Reduce 之后的结果,但我不太确定。
谁能更详细地了解什么是“中间结果”以及它们在 Spark 和 Hadoop 之间的差异?
【问题讨论】:
标签: apache-spark hadoop mapreduce