2015-01-26 142 views
3

我有一个卡夫卡集群数据中心。一些可以通过WAN(甚至是互联网)进行通信的客户端将向集群发送/接收实时消息。Kafka生产者/广域网上的消费者?

我从Kafka's Documentation阅读:

...这是可能的读取或写入远程集群卡夫卡在广域网上,虽然TCP调整将是必要的高延迟链路。

它通常是不可取的运行跨多个数据中心为这将产生很高的复制延迟无论是卡夫卡写和写动物园管理员既不卡夫卡也不动物园管理员将保持可用,如果网络分区的单一卡夫卡集群。

据我了解herehere

  • 生产在WAN上不需要ZK并没有问题,只是心中调整,以TCP进行高延迟的连接。大!检查。
  • 的高级用户API需要ZK连接。

又不是那么客户端读取/上述大胆通过WAN主题写卡夫卡为集群相同的限制?

回答

2

已经突出显示的语句大多针对的是卡夫卡/饲养员集群中邪恶的东西将在这期间是跨越WAN更常见的网络分区之间发生的内部通信。

生产者是孤立的,如果有网络问题应该能够根据您的设置缓冲/重试。

高层次的消费者是因为棘手,因为你注意,需要到动物园管理员的连接。在这种情况下,当发生断线时,将会有重新平衡,而更高的机会信息将会重复。

请记住,制片人需要能够找到每个卡夫卡经纪人,而消费者需要能够到达所有动物园管理员节点和卡夫卡经纪人,负载平衡器将无法工作。