【问题标题】:Kafka Streams KTable foreign key join not working as expectedKafka Streams KTable 外键连接未按预期工作
【发布时间】:2021-12-03 22:02:15
【问题描述】:

我正在尝试在 Kafka Streams 中加入一个简单的外键连接,类似于许多文章(例如:https://www.confluent.io/blog/data-enrichment-with-kafka-streams-foreign-key-joins/)。

当我尝试将用户 id(用户表的主键)与 account_balance 表中的外键 user_id 连接以生成 AccountRecord 对象时,我收到以下错误: [-StreamThread-1] ignJoinSubscriptionSendProcessorSupplier : Skipping record due to null foreign key.

最终目标是在任一表中的任何字段更新时将AccountRecord 传递给主题。问题是当我简单地分别打印用户表和帐户表时,外键和所有字段都被完全填充。我看不出有什么问题或为什么会发生此错误。这是我的代码的 sn-p:

    public void start_test(){
        StreamsBuilder builder = new StreamsBuilder();

        KTable<Long, User> userTable = builder.table(USER_TOPIC, Consumed.with(CustomSerdes.UserPKey(), CustomSerdes.User()));
        KTable<Long, AccountBalance> accountBalanceTable = builder.table(ACCOUNT_BALANCE_TOPIC, Consumed.with(CustomSerdes.UserPKey(), CustomSerdes.AccountBalance()));

        final KTable<Long, AccountRecord> accountRecordTable = accountBalanceTable.join(
                userTable,
                AccountBalance::getUserId,
                (account, user) -> new AccountRecord(user.getFirstName(), account.getBalance());
        );

        // print the table
        accountRecordTable
                .toStream()
                .print(Printed.toSysOut());

        KafkaStreams stream = new KafkaStreams(builder.build(), properties);
        stream.start();
    }

任何指导都会有所帮助。我没有包含自定义 serde 代码或对象形状,但它们非常简单。如果您需要进一步说明,请告诉我。

谢谢

【问题讨论】:

    标签: java apache-kafka-streams apache-kafka-connect confluent-platform


    【解决方案1】:

    您的消息是否包含关键记录? KTable 是对 changelog 流的抽象,其中每条数据记录都代表一个更新,通过 key 知道更新的方法,对于当前使用 KTables 来说非常重要的是记录的 key。 例如

    AccountBalance<Key=10,Value={accountBalanceId=10,userId=777,balance=10}>
    User<Key=777, Value={firstName="Panchito"}>
    

    另一个观察是您的 Serde 键,如果您将 Long 定义为键,为什么要使用自定义 serde?​​p>

    KTable<Long, User> userTable = builder.table(USER_TOPIC, Consumed.with(Serdes.Long(), CustomSerdes.User()));
    
    KTable<Long, AccountBalance> accountBalanceTable = builder.table(ACCOUNT_BALANCE_TOPIC, Consumed.with(Serdes.Long(), CustomSerdes.AccountBalance()))
    

    也许您的密钥反序列化程序将密钥作为空值发送。检查您的自定义 Serde 的输出登录输出。 此外,您还必须改进添加物化的 join 方法,因为您正在创建一个新对象,而 Kafka 不知道如何处理新对象。

          final KTable<Long, AccountRecord> accountRecordTable = accountBalanceTable.join(
                        userTable,
                        AccountBalance::getUserId,
                        (account, user) -> new AccountRecord(user.getFirstName(), account.getBalance()),
    Materialized.with(Serdes.Long(), CustomSerdes.AccountBalanceSerde() )
                );
    

    尝试使用 JsonSerde 或 Avro 来创建您的自定义 Serdes。

    【讨论】:

    • 感谢您的回复,我已将您的答案标记为正确。你说得对,问题出在 serde 上。实际上,问题在于帐户记录的 Json Serializer 自定义 serde。我必须将其配置为处理 snake_case,与反序列化器相同。
    猜你喜欢
    • 1970-01-01
    • 2020-05-08
    • 2013-08-06
    • 2022-01-09
    • 1970-01-01
    • 2015-06-17
    • 2021-09-17
    • 2021-03-13
    • 2020-01-26
    相关资源
    最近更新 更多