【发布时间】:2017-07-04 16:07:22
【问题描述】:
是否有符合这些要求的产品:
- 运行类似 SQL 的查询(最好使用友好的 UI,但必要时可以使用命令行)
- 跨越数百万个文档的大部分静态 JSON 数据集,没有一致的架构
- JSON 文档存储在云端,而不是本地。
基本上,我想要 Google BigQuery,但不需要一致的预先指定架构。
Apache Drill 提供跨具有不同模式的大型 JSON 数据集的类似 SQL 的查询。但是,我认为它不适用于云托管的数据集 - 已将其设置为与 S3 存储桶通信,并且似乎需要在本地下载所有数据,这使得它无法用于大型数据集。
【问题讨论】:
标签: json google-bigquery apache-drill bigdata