【发布时间】:2015-07-10 09:57:57
【问题描述】:
我们正在尝试在 hadoop 生态系统之上构建多租户。
我们的生态系统通常由 hadoop 组件组成,例如 hdfs、yarn、hive、oozie、zookeeper。
到目前为止,我已经研究过类似的概念
它在每个联合 HDFS 分区的单独名称节点的帮助下联合您的分布式存储 (HDFS)。
问题:假设您有 2 个租户用于单个集群,因此 2 个 namenode,2 个 namenode 将意味着 2 个 hive 服务器、2 个 oozie 服务器以及类似的每个其他 hadoop 组件中的 2 个,它们将与各自的 namenode 通信并写入各自的HDFS 分区。
可以为每个租户强制执行计算配额。(比如租户 1 - 50% 和租户 2 - 50%)
我找不到如何为 hadoop 集群开发类似的多租户环境。
我想做的是每个租户(及其用户)都会有一个
- 计算配额(通过容量调度程序)
- HDFS 中每个租户的 HDFS 目录(如 /usr/tenant1、/usr/tenant2)
所有属于tenant1组的用户都可以写入hdfs目录(/usr/tenant1/username)
我遇到的问题是.. 假设我以租户 1 用户身份从 hive 创建表,它创建表 /apps/hive/warehouse 类似 /apps/oozie/data。我在想的是它将在用户的 hdfs 主目录中创建表,因此只有租户 1 用户可以访问它。但它没有发生。
我能否就如何进行开发以在 Hadoop 生态系统上创建多租户获得一些帮助?
【问题讨论】:
标签: hadoop hive multi-tenant