【发布时间】:2015-06-03 12:13:28
【问题描述】:
我正在学习计算机工程。我正在考虑学习 Google Cloud Dataflow。
所以我想问作为 UG 的学生学习 Google Cloud Dataflow 是否很好。此外,我对大数据或 Hadoop 没有太多经验。
如果是,那我该如何开始学习呢?
【问题讨论】:
-
也许您可以从 BigData 开始,这样您将通过 2-3 步进入 Hadoop,在了解它们是什么之后,您可以启动 Google Cloud Dataflow。网上有很多电子书,你一定能找到
-
那么是不是先学习并具备一些hadoop和MapReduce框架的专业知识和知识,然后再开始使用Cloud Dataflow呢?
-
请注意,MapReduce 模型(粗略地说,一个巨大的 SELECT 后跟一个巨大的 GROUP BY)是 Dataflow 提供的一个微不足道的特例(对它们进行操作的逻辑集合,MapReduce 只是可能的操作链之一)。您能否澄清一下您的学习目标是什么?您想学习在实践中处理大数据,您想学习相关的理论概念/算法,还是您想了解大数据处理框架内部是如何工作的?
-
我想学习如何在实践和算法中处理大数据......以及在某种程度上框架是如何工作的。
标签: bigdata google-bigquery google-cloud-platform google-cloud-dataflow