我正在设计高吞吐量系统,我要有几个生产者。分区间消息的不均匀分布对Kafka集群的性能有不良影响吗?
我的主题将被分区。制作人将以键值对的形式发送记录。
键将用于分区数据。
消费者将组织在消费者群体中(他们将被分配相同的群组ID,以便他们可以同时消费来自同一主题的消息,但来自不同的分区)。
卡夫卡保证单个分区内的消息顺序。
消费者将被分配他们公平份额的分区。
唯一令我担心的是,我的分区密钥不会以循环方式分发消息,有些分区可能比其他分区更繁忙。
问:可能存在不均匀分区会以任何方式影响Kafka集群的性能?有没有红旗?
我知道有些消费者会有更多的工作要做,但那不是我最关心的问题。 在这个问题上的任何帮助将不胜感激。