我想问一下我对卡夫卡的理解是否正确。你使用Apache Kafka做什么?
对于真正的大数据流,传统的数据库是不够的,所以人们使用诸如Hadoop或Storm之类的东西。卡夫卡位于所述数据库的顶部,并提供...实时数据应该走的方向?
我想问一下我对卡夫卡的理解是否正确。你使用Apache Kafka做什么?
对于真正的大数据流,传统的数据库是不够的,所以人们使用诸如Hadoop或Storm之类的东西。卡夫卡位于所述数据库的顶部,并提供...实时数据应该走的方向?
我不这么认为。
卡夫卡是邮件系统和它不坐在数据库的顶部。
您可以通过消息系统比较卡夫卡像ActiveMQ的,的RabbitMQ等
从Apache文档page
卡夫卡是一个分布式,分区,复制的提交日志服务。它提供了消息传递系统的功能,但具有独特的设计。
关键要点:
客户端和服务器之间的通信是一个简单的,高性能的,与语言无关的TCP协议来完成。
使用案例:
对不起,但我不明白为什么我们有Kafa的任务看起来像服务器和客户端之间的通信? –
在两个不同的企业服务/系统之间提供松耦合。发送者和接收者服务通过消息集成松散耦合。访问此链接:enterpriseintegrationpatterns.com和enterpriseintegrationpatterns.com/patterns/messaging –
要充分认识Apache Kafka
角色,你应该得到更广泛的图片,并知道卡夫卡用例。现代数据处理系统试图打破传统的应用程序架构。你可以开始形式卡帕架构概述:
在这种架构中,你不电流world state
存储在任何SQL或键值数据库。所有数据都被处理并作为一系列事件存储在仅附加的不可变日志中。不变事件更容易在分布式环境中复制和存储。 Apache Kafka是一个在其他系统组件之间进行代理和存储这些事件的元素。
在Apache卡夫卡的官方网站用例:http://kafka.apache.org/documentation.html#uses
更多的用例: -
卡夫卡风暴管道 - 卡夫卡可以与Apache风暴被用于处理高速数据过滤管道即时模式匹配。
推荐阅读:http://www.confluent.io/blog/stream-data-platform-1/和http://www.confluent.io/blog/stream-data-platform-2/以及https: //englishering.linkedin.com/blog/topic/kafka –