【发布时间】:2020-05-14 01:38:51
【问题描述】:
我有一个包含少于 1000 条记录的 ksql 表。当我运行此查询 select * from table_name 时,查询开始返回任何数据之前最多需要 10 秒。
运行 Kafka、zookeeper、ksql 和模式注册表的机器没有过载或类似情况。
我正在使用带有 1 个代理和 1 个 ksql 服务器的开发设置。
该表具有简单的非嵌套 json,其中包含两个字段,电子邮件和用户 ID
这是一个问题,因为我不能将它用于单个查找,例如,使用这样的查询
SELECT * FROM TABLE_NAME WHERE col='value';
因为返回结果需要很长时间。我希望结果会立即返回。
如果我使用流而不是表格,所花费的时间是相同的
【问题讨论】:
-
这种行为是否仅适用于表查找?如果您对流尝试相同的操作,您会遇到不同的行为吗?你有多少经纪人?你有多少个ksql服务器?表中有哪些数据?
-
我已经用我的设置更新了问题
-
有趣,我认为这与您在主题中输入的数据有关。你能分享一些示例键和值吗?另外,KSQL 服务器是否有任何有见地的日志?
-
json {"email": "john@example.com", "user_id":"hahdjic-andud-hahd"}基本上是随机生成的电子邮件地址和 user_ids。消息密钥与电子邮件相同。我不知道这个位是否有用,但 user_ids 是相同的。它不应该影响性能,但也许是