我需要处理高峰期每秒100秒的记录。这些记录是简单的JSON体,它们应该被收集,然后处理/转换成数据库。Kinesis是我需要的正确工具吗? (和其他各种问题)
的几个问题...
1)是该室壁运动吧?或者SQS更适合?
2)当使用kinesis时,我想使用如下所示的python示例:https://aws.amazon.com/blogs/big-data/snakes-in-the-stream-feeding-and-eating-amazon-kinesis-streams-with-python/还是应该在KCL中实现我的生产者和消费者?有什么不同?
3)Kinesis是否向消费者的管理提供任何东西,或者我只是在EC2实例上运行它们并自己管理它们?
4)什么是访问数据的正确模式 - 我不能错过任何记录,所以我假设我会从“TRIM_HORIZON”而不是“最新”获取记录。如果是这样,我如何管理重复?换句话说,我的消费者如何从流中获取记录并处理消费者的关注等,并且始终知道他们正在获取所有记录?
谢谢!
你打算做什么样的处理?你关心维护他们订单的消息吗? –
嗨 - 消息不必维护订单,消费者所做的唯一处理就是转换为不同的格式并转发到其他服务。 –