【发布时间】:2018-10-20 14:33:07
【问题描述】:
目前,clickhouse 将数据存储在
/var/lib/clickhouse
路径,我已阅读它不支持深度存储。 顺便问一下,它在 config.xml 文件中是否有任何用于 hdfs 设置的配置?
【问题讨论】:
-
如果您在文档中没有找到它,那么我认为在这里询问不会帮助您找到答案
标签: hadoop hdfs clickhouse
目前,clickhouse 将数据存储在
/var/lib/clickhouse
路径,我已阅读它不支持深度存储。 顺便问一下,它在 config.xml 文件中是否有任何用于 hdfs 设置的配置?
【问题讨论】:
标签: hadoop hdfs clickhouse
将 clickhouse 数据目录存储到 HDFS 中,这是一个非常糟糕的主意 ;)
由于 HDFS 不兼容 posix 的文件系统,clickhouse 在这种部署变体上会非常慢
您可以使用https://github.com/jaykelin/clickhouse-hdfs-loader将数据从HDFS加载到clickhouse,在不久的将来https://clickhouse.yandex/docs/en/roadmap/clickhouse可能会支持PARQUET格式的数据加载
clickhouse 有自己的高可用性和集群化解决方案 请阅读 https://clickhouse.yandex/docs/en/operations/table_engines/replication/ 和 https://clickhouse.yandex/docs/en/operations/table_engines/distributed/
【讨论】:
HDFS 引擎允许通过 ClickHouse 管理 HDFS 上的数据,从而与 Apache Hadoop 生态系统集成。该引擎类似于文件和 URL 引擎,但提供了 Hadoop 特定的功能。
https://clickhouse.yandex/docs/ru/operations/table_engines/hdfs/
【讨论】: