【问题标题】:Is it possible to configure clickhouse data storage to be hdfs是否可以将clickhouse数据存储配置为hdfs
【发布时间】:2018-10-20 14:33:07
【问题描述】:

目前,clickhouse 将数据存储在

/var/lib/clickhouse

路径,我已阅读它不支持深度存储。 顺便问一下,它在 config.xml 文件中是否有任何用于 hdfs 设置的配置?

【问题讨论】:

  • 如果您在文档中没有找到它,那么我认为在这里询问不会帮助您找到答案

标签: hadoop hdfs clickhouse


【解决方案1】:

将 clickhouse 数据目录存储到 HDFS 中,这是一个非常糟糕的主意 ;)

由于 HDFS 不兼容 posix 的文件系统,clickhouse 在这种部署变体上会非常慢

您可以使用https://github.com/jaykelin/clickhouse-hdfs-loader将数据从HDFS加载到clickhouse,在不久的将来https://clickhouse.yandex/docs/en/roadmap/clickhouse可能会支持PARQUET格式的数据加载

clickhouse 有自己的高可用性和集群化解决方案 请阅读 https://clickhouse.yandex/docs/en/operations/table_engines/replication/https://clickhouse.yandex/docs/en/operations/table_engines/distributed/

【讨论】:

【解决方案2】:

HDFS 引擎允许通过 ClickHouse 管理 HDFS 上的数据,从而与 Apache Hadoop 生态系统集成。该引擎类似于文件和 URL 引擎,但提供了 Hadoop 特定的功能。

https://clickhouse.yandex/docs/ru/operations/table_engines/hdfs/

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-03-11
    • 2021-05-10
    相关资源
    最近更新 更多