【发布时间】:2017-10-21 18:11:05
【问题描述】:
在 CDH 的 NameNode 中,当我通过 odbc 脚本(php/perl 或 python)运行查询时,我可以在大约 30 秒内获取变量中的所有结果(9.2M) ,但是当我在另一台远程 2 服务器上尝试使用相同的脚本/查询时,执行时间在第一台服务器 28 分钟 和第二台服务器 17 分钟。
为了排除这是网络速度问题的假设,我在一个文件中获取结果,然后使用 scp 命令将其复制到第一个远程服务器,并在 ~40 秒内完成。
我在 CM 的查询信息中观察到,3 个查询中的 Threads: Network Send Wait Time 值之间存在很大差异:
在 NN 查询中:9.40s
在第一个远程服务器中:16.7m
在第二个远程服务器中:26.8m
我还尝试了一个带有 Impala JDBC 的 java 脚本,但是 NN 中的结果已经不刺激继续了。
但到目前为止,我找不到问题出在哪里以及如何解决它。
NB:我正在开发 CDH 5.12.0/Impala 2.9.0,我已安装 Impala ODBC 2.5.37.1014。
【问题讨论】:
标签: hadoop jdbc odbc impala unixodbc