【问题标题】:Falcon's role in Hadoop ecosystemFalcon 在 Hadoop 生态系统中的角色
【发布时间】:2015-02-24 07:03:34
【问题描述】:

我应该从事集群镜像工作,我必须设置与现有集群类似的 HDFS 集群(相同的主从集群)并将数据复制到新集群,然后运行相同的作业。

我已经阅读了有关 falcon 作为馈送处理和工作流程协调工具的信息,它也用于 HDFS 集群的镜像。有人可以告诉我 Falcon 在 Hadoop 生态系统中的作用是什么,特别是它如何帮助镜像。我希望在这里了解所有 facon 在我的 Hadoop 生态系统 (HDP) 中提供的功能。

【问题讨论】:

标签: hadoop hdfs bigdata hortonworks-data-platform apache-falcon


【解决方案1】:
  • Apache Falcon 通过以下方式简化了数据移动的配置:复制;生命周期管理;血统和可追溯性。这提供了跨 Hadoop 组件的数据治理一致性。
  • Falcon 复制与增量更改是异步的。恢复是通过运行一个进程并交换源和目标来完成的。
  • 数据丢失 - 如果主集群完全关闭,增量数据可能会丢失
  • 可以根据带宽和网络可用性在需要时安排备份。

【讨论】:

  • 还有其他参数,但我强调了那些非常重要的参数。
猜你喜欢
  • 2012-05-19
  • 1970-01-01
  • 1970-01-01
  • 2014-04-07
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2019-01-26
  • 2014-01-11
相关资源
最近更新 更多