2013-04-07 144 views
2

这涉及阵列字段(一个或多个)和正常字段(一个或多个)的总和是样品收集:聚合MongoDB中

{'f1': 10, '_id': 1, 'key': 'g', 'items': [{'i1': 10}, {'i1': 10}, {'i1': 10}]} 
{'f1': 10, '_id': 2, 'key': 'g', 'items': [{'i1': 10}, {'i1': 10}, {'i1': 10}]} 
{'f1': 77, '_id': 3, 'key': 'g', 'items': [{'i1': 10}, {'i1': 10}, {'i1': 10}]} 

我要像下式:$sum(f1 + Σ[items.i1])到上述收集来计算。以下是我能想出的(在pymongo):

db.collec.aggregate([  
     { "$unwind" : "$items"}, 
    { "$group" : {  
      "_id" : {"key": "$key", "id": "$_id"},  
    "matches" : { "$sum" : "$items.i1" },  
    "extra" : { "$sum" : "$f1" },  
    "count" : {"$sum": 1}  
        }}, 
    { "$group": {  
      "_id" : "$_id.key",  
      "finalSum":{ "$sum":  
         { "$add": ["$matches", {"$divide":["$extra", "$count"]}]}}}}  
    ]); 

输出:

{'finalSum': 187.0, '_id': 'g'} 

虽然这给正确的输出,我希望有这个更好的,更简单的解决方案: 任何帮助高度赞赏。

回答

3

当您对文档进行分组时,您可以将“f1”保存到_id字段,以便您不需要对其进行汇总并对每个文档进行分割。

聚集操作是这样的:

db.collec.aggregate([  
    { "$unwind" : "$items"}, 
    { "$group" : {  
      _id : {key: "$key", id: "$_id", f1 : "$f1" },  
      matches : { "$sum" : "$items.i1" },  
    }}, 
    { "$group": {  
      _id : "$_id.key",  
      finalSum : { "$sum":  
         { "$add": ["$matches", "$_id.f1"]}}}}  
    ]); 
+0

感谢琳达。这似乎是一个更好的解决方案。然而,我想知道16MB的文件限制可能不允许这种情况下的大量记录和足够的独特'键' - 'F1'组合。另外,是否有任何标准的方法呢?除了写多个'$ group'? – ranjjose 2013-04-14 13:58:58