【发布时间】:2019-09-08 15:44:42
【问题描述】:
我们有基于 ambari 的 Hadoop 集群 由于 thrift 服务器性能不佳,我们决定用 presto 替换它 我们当前的 Hadoop 集群有以下机器 960台数据节点机器(基于redhat 7 OS)
关于 presto- 的几句话 Presto(或 PrestoDB)是一个开源的分布式 SQL 查询引擎,从头开始设计用于对任何大小的数据进行快速分析查询。它支持非关系源,例如 Hadoop 分布式文件系统 (HDFS),
我们安装了新的 presto 服务器如下 首先我们安装了操作系统(redhat 7),一共13台机器 1 台用于 presto 协调器的机器 还有 12 台机器供 presto 工人使用
安装操作系统后 我们成功安装了 presto(presto coordinator + presto workers)
现在我们被困在如何在 presto 集群和 Hadoop 集群之间进行集成
我将给出关于 hive 连接器 (hive.properties) 的简短示例
我们有以下变量 hive.config.resources=/etc/hadoop/conf/core-site.xml,/etc/hadoop/conf/hdfs-site.xml
由于这个文件位于数据节点机器上,当然不在 presto worker 机器上,我假设我们需要将这些文件从数据节点机器复制到 presto worker 机器
我在吗?
【问题讨论】: