【问题标题】:How to install Kudu?如何安装酷都?
【发布时间】:2025-12-10 02:05:01
【问题描述】:

我熟悉 hive、hbase、hdfs 等 hadoop 组件。但我对 Apache Kudu 非常陌生。

到目前为止,根据我的研究,我了解到 kudu 只不过是像镶木地板一样的柱状存储。它也比 Hbase 更快。

但我仍然找不到任何有效的 kudu 安装文档。即使我想知道我是否真的需要为 kudu 或它在 hadoop(EMR 或 Dataproc)中的内置安装任何单独的包。

请帮助我如何开始动手操作 kudu。

【问题讨论】:

  • 对此事的看法非常糟糕。例如,它是可变的。

标签: hadoop amazon-emr google-cloud-dataproc apache-kudu


【解决方案1】:

Kudu 不是一种文件格式,而是一种不同的存储引擎。将其视为 HDFS(或 S3)的并行/替代文件系统。是的,它确实需要安装 Master 和 Tablet 服务器,请参阅 Apache 网站上的 Architecture Overview

由于它是一个开源的 Apache 项目,安装说明也可以在 Apache 网站上找到:https://kudu.apache.org/docs/installation.html

【讨论】:

  • @thebluephantom 就过于粗粒度,孤注一掷?是的,tru dat...希望通过 Ranger 集成会变得更好docs.cloudera.com/runtime/7.1.1/administering-kudu/topics/…
  • 感谢@mazaneicha 的回答。我可以在不存在 hadoop 的新创建的 EC2 机器上安装 kudu 吗?或者我需要在 hadoop 上安装 kudu ?
  • Kudu 本身不依赖于 Hadoop 生态系统的任何部分。虽然 Spark、Impala 和 Hive Metastore 可以成为处理存储在 Kudu 中的数据的工具。