2015-12-03 70 views
0

我有两个集合的集合 收集一个的结构MongoDB的更新基于另一个集合

{'click_id':"123345", 
... 
} 

集合两者的结构是

{'click_id':"123345", 
... 

} 

是什么做的最佳方式以下集合1

{'click_id':"123345", 
'collection2':true, 
... 
    } 

考虑到有这样的事实约1十亿记录收集1和2收集

+0

怎么样click_id的两个集合中的独特性? –

+0

click_id是在两个独特的收藏 –

回答

0

约30万条记录,据我知道你不能做的东西像SQL JOIN DB的有关MongoDB。

如果你的工作是批处理,并且你可以将第二个集合看作状态快照,那么你可以将所有3000万个ID加载到内存中(应该低于1 GB,但它取决于ID的长度)作为词典/地图。

然后通过所有1个十亿记录从第一去收集和保存批量插入结果/更新(IDK你想要的)。