我在读this SO answer和许多这样的博客。多个消费群体消费者如何在卡夫卡的同一主题上跨越分区工作?
我所知道的:
多的消费者可以运行多个消费者在使用多个消费群ID,并从消费群体只有一个消费者可以从一个分区给定的时间消耗在单个分区上运行。
我的问题是从多的消费群体从同一主题消费相关多个消费者:
在多种消费(不同组)的情况下,会发生什么耗时一个主题(最终是同一个分区)?
他们是否得到相同的数据?
如何管理偏移量?每个消费者是否分开?
(可能是基于意见)您或一般推荐的方式是如何处理在单个分区上运行的单独组的两个使用者之间的重叠数据?
编辑: “重叠数据”:指两个消费者在同一分区获得相同数据进行操作单独的消费群。
感谢您的回复。你能建议如何处理第四个问题吗? –
你能解释一下“重叠数据”的含义吗? –
如果为了提高性能,我决定在一个分区上使用来自不同用户组的两位消费者。那么,如果单独的消费者群体的消费者获得相同的数据如何处理这种数据冗余,并确保每个消息在两个消费者中只处理一次? –