【问题标题】:KSQL ( Confluent ) VS Hive Kafka SQL ( Hortanworks ) [closed]KSQL(Confluent)VS Hive Kafka SQL(Hortanworks)[关闭]
【发布时间】:2019-05-28 08:58:30
【问题描述】:

有什么区别? 哪一个更好 ? 什么时候使用?

Hive Kafka SQL

KSQL

【问题讨论】:

    标签: hive apache-kafka hortonworks-data-platform confluent-platform ksqldb


    【解决方案1】:

    安装

    KSQL使用Kafka Streams,不依赖Hive,只依赖Kafka和Zookeeper

    Hive-Kakfa 需要 Kafka、HiveServer 和 RDBMS(MySQL、Postgres 等)。

    生态系统

    对于外部集成,Hive-Kafka 不提供 Confluent Avro Schema Registry 集成。不过,它可能(最终?)提供 Hortonworks Schema Registry 集成。

    Hortonwork 围绕 NiFi、Spark、Kafka、SMM、Atlas、Ranger、Hive-Streaming 等的工具套件可能都经过了很好的测试。

    Confluent 与其他公司合作,以确保与 Kafka 及其平台以外的其他工具进行适当的集成。

    界面

    AFAIK,Hive-Kafka 只是一个查询引擎,它不会像 KSQL 那样创建/维护 KStreams/KTable 实例,并且始终需要扫描 Kafka 主题。它也没有用于提交查询的本机 REST 接口,因此外部访问的唯一选择是 JDBC/ODBC。

    对于 UI,Hive 可以很好地与 HUE 或 Ambari Views 配合使用,它们都是开源的,但 KSQL 主要只有 Confluent Control Center,这是一种付费解决方案。



    “更好”是一种意见,但如果您已经拥有 Hive,我认为没有理由不使用 Hive-Kafka。

    IMO,KSQL 可以通过将新主题定义为表和流,以及将 Confleunt 的 Avro 格式转换/过滤为 Hive-Kafka 可以本机理解的 JSON,来恭维 Hive-Kafka。从那里您可以将现有的 Hive 数据(HDFS、S3、HBase 等)与 Hive-Kafka 数据相结合,但可能会对性能产生影响。

    同样,您可以使用 Schema Registry 将 Hive-Kafka 主题转换为 KSQL 中的 Avro,以便与 Kafka Connect 或 NiFi 等其他工具一起使用,以获得更高效的有线格式(binary-avro 与 json)。


    FWIW,看看你的第一个链接的 cmets 部分

    这种集成与 KSQL 非常不同。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2021-10-04
      • 2021-05-09
      • 1970-01-01
      • 2017-06-16
      • 1970-01-01
      • 1970-01-01
      • 2019-06-12
      • 2020-05-01
      相关资源
      最近更新 更多