【发布时间】:2013-04-22 16:38:55
【问题描述】:
我正在尝试编写一个可以被来自 Sql 背景的人轻松使用的包装器。我还没有开始这项工作,我想知道我应该采取什么方法。
这是问题陈述——如果有人在他们的 rdbms 数据上写了很多本机 Sql,并且他们想切换到 hadoop,那么就会有很多问题。 Hive 消除了在 hdfs 中构建表的一个主要问题。现在是查询部分——为此我们有不同的框架,但没有一个框架本身是完整的——比如一个可能很慢,而另一个可能缺乏功能。例如,有 Impala,有 Hive QL,但对于最终用户来说,没有 ONE 框架。 我打算做这样的事情 - select(comma-separated string of column names, tableName).where(filter-expression)....
类似 Linq for hdfs 之类的东西,它会找出执行 select(hive ql 或 Impala)的最佳方式、执行 where 子句的最佳方式等。
建议?想法?批评?
谢谢
【问题讨论】: