我正在用Apache Storm评估Mongo DB。我的用例是我必须从Apache Storm中的MongoDB中读取数据,在bolt中做一些处理并将其转储到Neo4J图形数据库中。Mongodb oplog同步
我使用的是蒙戈喷口,这将从OPLOG文件中读取数据。我查看了主节点将数据写入oplog文件的文档,并且副本读取将以异步方式发生。我知道oplog是一个封闭的集合(指定的大小),数据以很高的速度写入oplog,同步到副本集有点慢。如果oplog达到其最大大小,它会覆盖文件开头的文档。在异步过程中,如果我们获得其他数据,并且复制仍处于完成状态,则可能会丢失复制集,因为它不会同步。
我在这里的问题是
1)有什么办法来克服这个?
2)使用Apache Storm时,我们可以如何更好地使用这个加盖的集合?
3)如果给最大OPLOG大小如我给500GB和OPLOG拥有1GB的数据将其占领和大小的储备500GB?
4)这是我的用例的正确解决方案吗?
在此先感谢!